已选标签:
1月 6日
9 条新闻
11:26

微软计划本财年砸下 800 亿美元,建设符合 AI 工作需求的数据中心

微软计划在2025财年投资800亿美元建设支持人工智能运算的数据中心,其中超过一半的资金将投向美国市场。微软副董事长布拉德·史密斯表示,美国在全球AI竞赛中处于领先地位,得益于私人资本投入和技术创新。微软已向OpenAI投资超过130亿美元,将其AI模型整合到Windows、Teams等产品中。
来源:IT之家

来源:AI工具集

11:26

「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用

昆仑万维集团宣布,「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP,供用户免费使用。o1版专注于中文逻辑推理,具备强大的数学、代码、逻辑、常识和伦理决策能力,通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型,语音对话助手Skyo具有情感表达和多语言切换能力,提供流畅的实时对话体验。
来源:昆仑万维集团

来源:AI工具集

11:26

阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 推出了 CodeElo 基准测试,利用 Elo 评级系统评估大语言模型(LLM)的编程能力。CodeElo 通过 CodeForces 平台的题目进行测试,确保评估的准确性和全面性。在测试中,OpenAI 的 o1-mini 模型表现最佳,Elo 评分为 1578,超过了 90% 的人类程序员。
来源:AI工具集

来源:AI工具集

10:35

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT

来源:GitHub

08:56

萨姆·阿尔特曼对解雇他的OpenAI董事会成员有话要说

OpenAI CEO Sam Altman 在采访中透露了公司未来技术发展方向,包括芯片计划和大语言模型 ChatGPT 的定价策略。这一事件凸显了 AI 企业在技术研发与商业化落地中的关键挑战,如算力优化、成本控制和商业模式的探索。OpenAI 的技术路线将继续影响大语言模型和多模态 AI 的发展,推动其在智能助手、AI 编程等领域的应用深化。

来源:TechCrunch AI

00:00

DDUF:统一扩散模型分发与权重保存的单文件格式

DDUF:统一扩散模型分发与权重保存的单文件格式

DDUF(DDUF’s Diffusion Unified Format)是一种为扩散模型设计的单文件格式,旨在统一不同的模型分发方法和权重保存格式。它将模型的所有组件打包到一个文件中,并且与语言无关,支持远程解析。目前社区热门的模型已经有专门的 DDUF 格式了,之前看到一大堆文件就头疼,以后就好了。

来源:三花快讯

1月 4日
1 条新闻
00:00

微软计划在2025财年投入800亿美元用于人工智能数据中心

微软计划在2025财年投入800亿美元建设AI数据中心,主要用于训练AI模型和部署全球AI及云应用。其中超半数投资将用于美国,旨在推动AI技术创新和生产力提升。微软与OpenAI正合作开发名为Stargate的AI超级计算机数据中心,预计耗资超1000亿美元。此举凸显AI对算力和电力的巨大需求,可能引发数据中心电力短缺问题,同时也标志着AI基础设施建设的全球竞争加剧。

来源:TechCrunch AI

1月 3日
3 条新闻
17:08

阿里入局 AI 眼镜:与雷鸟达成战略合作,产品将接入通义大模型

阿里入局 AI 眼镜:与雷鸟达成战略合作,产品将接入通义大模型

雷鸟创新与阿里云达成AI眼镜领域的独家战略合作,阿里云通义大模型将为雷鸟AI眼镜提供技术支持。是国内首次大模型与AI眼镜硬件厂商深度定制合作。双方将共同投入研发资源,围绕云计算、大模型、AI硬件等领域合作。雷鸟计划于1月7日发布雷鸟V3 AI拍摄眼镜。
来源:IT之家

来源:AI工具集

00:00

xAI的下一代AI模型未能按时发布,延续了这一趋势。

xAI 的下一代大模型 Grok 3 未能如期发布,反映了当前 AI 模型发展的技术瓶颈。尽管 Elon Musk 曾表示 Grok 3 将在 2024 年底推出,并基于 10 万块 H100 GPU 进行训练,但至今未见其踪影。这一延迟与 Anthropic、Google 和 OpenAI 等公司在旗舰模型发布上的挫折相呼应,凸显了现有 AI 扩展法则的局限性。随着模型性能提升的边际效益递减,企业正探索替代技术路径。此外,xAI 团队规模较小也可能影响了开发进度。这一趋势表明,传统 AI 训练方法正面临瓶颈,亟需技术创新以突破现有局限。

来源:TechCrunch AI

1月 2日
7 条新闻
18:05

谷歌前CEO施密特预测:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备

谷歌前CEO埃里克·施密特预测,2025年AI将实现三大突破:获得“永久记忆”、智能体从对话到行动的飞跃、文本到行动的编程革命。他强调AI变革将“一切,无处不在,同时发生”,警告美国可能在2028年耗尽能源储备,因数据中心耗电量巨大。
来源:36Kr

来源:AI工具集

18:05

智象未来多模态大模型3.0全球首发

智象未来发布智象多模态生成大模型3.0和智象多模态理解大模型1.0,旨在提升视觉多模态基础模型服务,激发创造力。创始人梅涛院士强调了AI技术在推动科学发展和具身智能方面的重要性,提出了大模型通往AGI的两条路径。
来源:HiDream智象未来

来源:AI工具集

00:00

百度推出全新AI搜索引擎“AI搜”,整合多内容生态,提供无广告权威结果

百度推出全新AI搜索引擎“AI搜”,整合多内容生态,提供无广告权威结果

百度近期在Web端首页推出全新的搜索引擎入口“AI搜”(Chat.baidu.com),基于文心大模型,整合了百度搜索、健康、律临、文库、教育等多内容生态,提供无广告、可靠和权威的搜索结果。功能涵盖话题探索、问题解决、决策辅助等,支持文生图、逻辑推理、智能摘要等AI技术。用户还可创建智能体并互动,提升个性化体验。李彦宏宣布2025年初将推出文心大模型新版本,持续加强AI技术应用。

来源:AI Base

00:00

一年800亿,字节凶猛,追赶AI

一年800亿,字节凶猛,追赶AI

字节跳动在大模型领域起步较晚,但凭借强大的资源投入和战略布局,迅速崛起。2024年,豆包App月活跃用户达5998万,跃居全球第二、国内第一。字节通过C端高强度市场投放、B端低价策略及持续的算力和人才投入,在短短一年多内实现了从“迟到者”到“破局者”的转变。此外,字节正构建全面的AI产品生态体系,涵盖大模型产品、基础AI开发、AI社交等多领域,目标是再造一个“AI工厂”。

来源:TechWeb