AI新闻 | 第3页 | goodux 好体验

标签筛选

已选标签:

1月 6日

9 条新闻

11:26

微软计划本财年砸下 800 亿美元，建设符合 AI 工作需求的数据中心

微软计划在2025财年投资800亿美元建设支持人工智能运算的数据中心，其中超过一半的资金将投向美国市场。微软副董事长布拉德·史密斯表示，美国在全球AI竞赛中处于领先地位，得益于私人资本投入和技术创新。微软已向OpenAI投资超过130亿美元，将其AI模型整合到Windows、Teams等产品中。
来源：IT之家

来源：AI工具集

11:26

「天工大模型4.0」o1版和4o版正式上线天工APP和网页，免费使用

昆仑万维集团宣布，「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP，供用户免费使用。o1版专注于中文逻辑推理，具备强大的数学、代码、逻辑、常识和伦理决策能力，通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型，语音对话助手Skyo具有情感表达和多语言切换能力，提供流畅的实时对话体验。
来源：昆仑万维集团

来源：AI工具集

11:26

马斯克称 Grok 3 即将推出：已完成预训练，计算量比 Grok 2 高十倍

马斯克宣布 Grok 3 即将推出，预训练已完成，计算量比 Grok 2 高出十倍。去年 7 月，Grok 3 使用了 10 万块英伟达 H100 芯片进行训练，但未能如期发布。去年 12 月，xAI 向所有 𝕏 平台用户免费推出了 Grok-2 模型，Premium 用户将优先访问新功能。
来源：IT之家

来源：AI工具集

11:26

阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 推出了 CodeElo 基准测试，利用 Elo 评级系统评估大语言模型（LLM）的编程能力。CodeElo 通过 CodeForces 平台的题目进行测试，确保评估的准确性和全面性。在测试中，OpenAI 的 o1-mini 模型表现最佳，Elo 评分为 1578，超过了 90% 的人类程序员。
来源：AI工具集

来源：AI工具集

11:26

谷歌 DeepMind 推 CAT4D：普通视频变 3D 大片，单视角视频也能转换多视角了

谷歌 DeepMind 联合哥伦比亚大学和加州大学圣地亚哥分校开发了 CAT4D AI 系统，能够将普通视频转化为动态 3D 场景。系统基于扩散模型，将单视角视频转换为多视角视图，用户可以从不同角度观看视频中的主体。
来源：AI工具集

来源：AI工具集

10:35

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型，采用隐式扩散模型实现自监督层级化妆迁移，已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型，已开源并验证可正常训练和推理。此外，团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接：https://github.com/Snowfallingplum/SHMT

来源：GitHub

08:56

萨姆·阿尔特曼对解雇他的OpenAI董事会成员有话要说

OpenAI CEO Sam Altman 在采访中透露了公司未来技术发展方向，包括芯片计划和大语言模型 ChatGPT 的定价策略。这一事件凸显了 AI 企业在技术研发与商业化落地中的关键挑战，如算力优化、成本控制和商业模式的探索。OpenAI 的技术路线将继续影响大语言模型和多模态 AI 的发展，推动其在智能助手、AI 编程等领域的应用深化。

来源：TechCrunch AI

00:00

字节开源 LatentSync：高效口型同步扩散模型

字节开源 LatentSync：高效口型同步扩散模型

LatentSync 是字节开源的用于口型同步的扩散模型，只需提供角色视频和要同步的音频即可生成。该模型对硬件的要求适中，仅需 6.5 GB 的 GPU 即可运行，适合大多数开发者和研究人员使用。此外，@fffiloni大佬还提供了一个在线演示可以玩一下。

来源：三花快讯

00:00

DDUF：统一扩散模型分发与权重保存的单文件格式

DDUF：统一扩散模型分发与权重保存的单文件格式

DDUF（DDUF’s Diffusion Unified Format）是一种为扩散模型设计的单文件格式，旨在统一不同的模型分发方法和权重保存格式。它将模型的所有组件打包到一个文件中，并且与语言无关，支持远程解析。目前社区热门的模型已经有专门的 DDUF 格式了，之前看到一大堆文件就头疼，以后就好了。

来源：三花快讯

1月 4日

1 条新闻

00:00

微软计划在2025财年投入800亿美元用于人工智能数据中心

微软计划在2025财年投入800亿美元建设AI数据中心，主要用于训练AI模型和部署全球AI及云应用。其中超半数投资将用于美国，旨在推动AI技术创新和生产力提升。微软与OpenAI正合作开发名为Stargate的AI超级计算机数据中心，预计耗资超1000亿美元。此举凸显AI对算力和电力的巨大需求，可能引发数据中心电力短缺问题，同时也标志着AI基础设施建设的全球竞争加剧。

来源：TechCrunch AI

1月 3日

3 条新闻

17:08

阿里入局 AI 眼镜：与雷鸟达成战略合作，产品将接入通义大模型

阿里入局 AI 眼镜：与雷鸟达成战略合作，产品将接入通义大模型

雷鸟创新与阿里云达成AI眼镜领域的独家战略合作，阿里云通义大模型将为雷鸟AI眼镜提供技术支持。是国内首次大模型与AI眼镜硬件厂商深度定制合作。双方将共同投入研发资源，围绕云计算、大模型、AI硬件等领域合作。雷鸟计划于1月7日发布雷鸟V3 AI拍摄眼镜。
来源：IT之家

来源：AI工具集

17:08

微软发布新模型 LAM ，可以自己操作Windows程序

微软发布新模型 LAM ，可以自己操作Windows程序

微软推出 LAM（Large Action Model）“大型动作模型” ，能够独立操作Windows程序，将用户请求转化为实际行动。是首个专门训练与微软Office产品一起工作的模型。在Word测试中，LAM的成功率达到71%，速度超过GPT-4o。
来源：AI工具集

来源：AI工具集

00:00

xAI的下一代AI模型未能按时发布，延续了这一趋势。

xAI 的下一代大模型 Grok 3 未能如期发布，反映了当前 AI 模型发展的技术瓶颈。尽管 Elon Musk 曾表示 Grok 3 将在 2024 年底推出，并基于 10 万块 H100 GPU 进行训练，但至今未见其踪影。这一延迟与 Anthropic、Google 和 OpenAI 等公司在旗舰模型发布上的挫折相呼应，凸显了现有 AI 扩展法则的局限性。随着模型性能提升的边际效益递减，企业正探索替代技术路径。此外，xAI 团队规模较小也可能影响了开发进度。这一趋势表明，传统 AI 训练方法正面临瓶颈，亟需技术创新以突破现有局限。

来源：TechCrunch AI

1月 2日

7 条新闻

18:05

谷歌前CEO施密特预测：AI 将在今年获得“永久记忆”，2028 美国会耗尽能源储备

谷歌前CEO埃里克·施密特预测，2025年AI将实现三大突破：获得“永久记忆”、智能体从对话到行动的飞跃、文本到行动的编程革命。他强调AI变革将“一切，无处不在，同时发生”，警告美国可能在2028年耗尽能源储备，因数据中心耗电量巨大。
来源：36Kr

来源：AI工具集

18:05

英伟达新一代显卡领衔，一波AIPC芯片产品有望亮相CES展

英伟达CEO黄仁勋将在CES 2025发表开幕演讲，可能发布新一代GeForce RTX50系列显卡。英特尔和AMD也预计在会上发布AIPC相关产品，推动AI芯片技术迭代。行业已进入用户体验探索阶段，AIPC芯片具备自然语言交互等特点，有望快速渗透PC市场，带动产业链升级。
来源：财联社

来源：AI工具集

18:05

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室”

阿里云与零一万物达成战略合作，共建“产业大模型联合实验室”，旨在加速大模型技术应用落地和产业生态整合。双方将结合研发实力，通过阿里云百炼大模型平台提供服务。进一步深化双方在AI大模型领域的合作。
来源：IT之家

来源：AI工具集

18:05

智象未来多模态大模型3.0全球首发

智象未来发布智象多模态生成大模型3.0和智象多模态理解大模型1.0，旨在提升视觉多模态基础模型服务，激发创造力。创始人梅涛院士强调了AI技术在推动科学发展和具身智能方面的重要性，提出了大模型通往AGI的两条路径。
来源：HiDream智象未来

来源：AI工具集

00:00

字节发布 VMix：提升扩散模型生图美学质量

字节发布 VMix：提升扩散模型生图美学质量

VMix 是字节发布的一项提升扩散模型生图美学的技术。它能够在颜色、光照、构图等细粒度维度上更精准地遵循提示词，同时还能兼容原有的 LoRA、ControlNet 和 IPAdapter。图片里演示的是对 SDXL 模型的增强，不过，VMix 现在还没有开源，关注我为你持续跟进。

来源：三花快讯

00:00

百度推出全新AI搜索引擎“AI搜”，整合多内容生态，提供无广告权威结果

百度推出全新AI搜索引擎“AI搜”，整合多内容生态，提供无广告权威结果

百度近期在Web端首页推出全新的搜索引擎入口“AI搜”（Chat.baidu.com），基于文心大模型，整合了百度搜索、健康、律临、文库、教育等多内容生态，提供无广告、可靠和权威的搜索结果。功能涵盖话题探索、问题解决、决策辅助等，支持文生图、逻辑推理、智能摘要等AI技术。用户还可创建智能体并互动，提升个性化体验。李彦宏宣布2025年初将推出文心大模型新版本，持续加强AI技术应用。

来源：AI Base

00:00

一年800亿，字节凶猛，追赶AI

一年800亿，字节凶猛，追赶AI

字节跳动在大模型领域起步较晚，但凭借强大的资源投入和战略布局，迅速崛起。2024年，豆包App月活跃用户达5998万，跃居全球第二、国内第一。字节通过C端高强度市场投放、B端低价策略及持续的算力和人才投入，在短短一年多内实现了从“迟到者”到“破局者”的转变。此外，字节正构建全面的AI产品生态体系，涵盖大模型产品、基础AI开发、AI社交等多领域，目标是再造一个“AI工厂”。

来源：TechWeb