已选标签:
1月 21日
1 条新闻
01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 19日
2 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

1月 15日
5 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI

00:45

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

量子计算初创公司 SEEQC 宣布获得 3000 万美元融资,致力于通过芯片技术简化量子硬件复杂性,推动量子计算与经典计算的融合。SEEQC 与 Nvidia 合作开发超低延迟芯片间连接技术,旨在提升量子计算与 GPU 的协同效率,支持数据中心和企业级应用。量子计算有望加速新材料和药物研发,德国化工巨头 BASF 和 Merck 已参与 SEEQC 主导的 QuPharma 项目。SEEQC 的技术源于 Hypres 的成熟芯片制造能力,未来将加速商业化进程,推动量子计算在 AI 和数据中心领域的应用。

来源:TechCrunch AI

1月 12日
1 条新闻
05:30

研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型

UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。

来源:TechCrunch AI

1月 10日
1 条新闻
02:10

马克·扎克伯格批准Meta的Llama团队使用受版权保护的作品进行训练,并提交相关声明

Meta 因使用盗版数据集 LibGen 训练 Llama 大语言模型面临版权诉讼。诉讼文件显示,Meta CEO 扎克伯格批准使用该数据集,尽管公司内部对版权风险存在担忧。Meta 被指控通过删除版权信息掩盖侵权行为,并采用 torrent 技术获取数据。此案凸显了 AI 模型训练中数据来源合法性的关键挑战,以及大模型开发与版权保护的复杂平衡。

来源:TechCrunch AI

1月 9日
2 条新闻
12:01

埃隆·马斯克同意我们已经耗尽了AI训练数据

Elon Musk 与多位 AI 专家一致认为,真实世界数据已接近耗尽,AI 模型训练面临数据瓶颈。Musk 指出,合成数据(AI 生成的数据)将成为未来关键解决方案,推动模型自我学习和优化。微软、Meta、OpenAI 等公司已广泛采用合成数据训练大模型,如 Phi-4、Gemma 和 Claude 3.5 Sonnet。合成数据可显著降低成本,但也存在模型崩溃和偏见加剧的风险。未来,AI 发展将更加依赖合成数据与技术创新,以突破数据限制并提升模型性能。

来源:TechCrunch AI

02:24

乌克兰黑客声称对攻击俄罗斯互联网服务提供商负责,该攻击摧毁了服务器并导致互联网中断

俄罗斯互联网服务提供商 Nodex 遭受乌克兰黑客组织攻击,导致其网络系统被完全破坏,服务器数据被擦除,客户互联网连接中断。此次事件凸显了网络安全在 AI 基础设施中的重要性,尤其是在分布式系统、数据备份和恢复等关键领域。AI 技术如联邦学习和强化学习可用于增强网络防御能力,而多模态模型和预训练模型在威胁检测和响应中具有潜力。未来,AI 驱动的网络安全解决方案将成为保护关键基础设施的重要趋势。

来源:TechCrunch AI

1月 8日
3 条新闻
01:30

实时更新 CES 2025:Nvidia 后续动态及 Linda Yaccarino 主题演讲,展会现场开启

Nvidia 在 CES 2025 上推出 Project Digits,一款个人 AI 超级计算机,搭载 Grace Blackwell 超级芯片,支持运行高达 2000 亿参数的模型。该设备旨在降低高性能 AI 计算的门槛,推动 AI 技术在边缘计算和个性化应用中的普及。同时,May Mobility 展示了电动自动驾驶小巴,进一步扩展 AI 在交通领域的落地场景。这些创新标志着 AI 技术向更高效、更普惠的方向发展,同时加速了 AI 在消费级和行业级应用的商业化进程。

来源:TechCrunch AI

1月 6日
2 条新闻
11:26

微软计划本财年砸下 800 亿美元,建设符合 AI 工作需求的数据中心

微软计划在2025财年投资800亿美元建设支持人工智能运算的数据中心,其中超过一半的资金将投向美国市场。微软副董事长布拉德·史密斯表示,美国在全球AI竞赛中处于领先地位,得益于私人资本投入和技术创新。微软已向OpenAI投资超过130亿美元,将其AI模型整合到Windows、Teams等产品中。
来源:IT之家

来源:AI工具集

10:35

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT

来源:GitHub

1月 4日
1 条新闻
00:00

微软计划在2025财年投入800亿美元用于人工智能数据中心

微软计划在2025财年投入800亿美元建设AI数据中心,主要用于训练AI模型和部署全球AI及云应用。其中超半数投资将用于美国,旨在推动AI技术创新和生产力提升。微软与OpenAI正合作开发名为Stargate的AI超级计算机数据中心,预计耗资超1000亿美元。此举凸显AI对算力和电力的巨大需求,可能引发数据中心电力短缺问题,同时也标志着AI基础设施建设的全球竞争加剧。

来源:TechCrunch AI

1月 3日
2 条新闻
00:00

xAI的下一代AI模型未能按时发布,延续了这一趋势。

xAI 的下一代大模型 Grok 3 未能如期发布,反映了当前 AI 模型发展的技术瓶颈。尽管 Elon Musk 曾表示 Grok 3 将在 2024 年底推出,并基于 10 万块 H100 GPU 进行训练,但至今未见其踪影。这一延迟与 Anthropic、Google 和 OpenAI 等公司在旗舰模型发布上的挫折相呼应,凸显了现有 AI 扩展法则的局限性。随着模型性能提升的边际效益递减,企业正探索替代技术路径。此外,xAI 团队规模较小也可能影响了开发进度。这一趋势表明,传统 AI 训练方法正面临瓶颈,亟需技术创新以突破现有局限。

来源:TechCrunch AI

00:00

2025年CES:期待年度首个且最大的科技展会带来什么

CES 2025 聚焦 AI 技术前沿,Nvidia 和 AMD 将在 GPU 领域展开激烈竞争,Nvidia 预计发布 GeForce RTX 50 GPU,进一步巩固其在 AI 芯片市场的领先地位。AI 技术将广泛应用于消费电子、汽车、家电等领域,推动多模态融合和边缘计算发展。尽管生成式 AI 设备如 Rabbit R1 和 Humane AI Pin 未能达到预期,AI 仍将是展会的核心议题,涵盖从芯片到智能助手、自动驾驶等多样化应用场景。

来源:TechCrunch AI