已选标签:
1月 21日
3 条新闻
06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具,旨在通过自主执行任务(如编写代码、预订旅行)提升用户效率。该工具基于 OpenAI CUA(计算机使用代理)模型,在 WebVoyager 等基准测试中表现优异,但在复杂任务(如创建比特币钱包)上成功率较低。尽管面临安全性和可靠性挑战,OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局,AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源:TechCrunch AI

06:28

朋友推迟其AI伴侶吊坠的发货

AI 初创公司 Friend 推迟其 99 美元的 AI 项链发货至 Q3,该产品旨在作为数字伴侣。公司 CEO 表示需进一步优化设计,预计 2 月底完成原型后进入最终生产阶段。Friend 此前通过 Friend.com 推出 AI 聊天机器人实验,但因生成内容引发争议,现已决定停止该服务,专注于硬件开发。AI 伴侣技术引发伦理争议,专家担忧其可能加剧社交孤立并产生有害内容。

来源:TechCrunch AI

01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 20日
9 条新闻
23:00

以下是企业风投在2025年希望支持的AI公司类型

2025年AI投资趋势聚焦于垂直领域应用与基础设施创新。VCs看好针对特定任务的AI解决方案,尤其是结合智能代理的模型,以推动企业数字化转型。重点领域包括:1)垂直行业工作流的生成式AI重构;2)AI驱动的安全与自动化创新;3)企业级AI基础设施,特别是边缘计算、推理优化和UI/UX演进。投资趋势强调从单一功能向平台化解决方案的转变,同时关注AI系统的可靠性与抗脆弱性设计。

来源:TechCrunch AI

16:33

X 正在美国为用户推出专属的垂直视频信息流

社交平台 X 推出垂直视频专区,利用 AI 驱动的推荐算法优化用户体验。此举旨在填补 TikTok 等应用在美国市场的空缺,通过深度学习技术提升视频内容的分发效率和用户粘性。X 此前已推出独立电视应用,显示其在视频领域的持续布局。随着 Meta 等竞争对手推出类似功能,AI 驱动的视频推荐和编辑工具正成为社交平台竞争的关键技术。未来,多模态模型和个性化推荐算法的进一步融合将推动视频内容生态的智能化发展。

来源:TechCrunch AI

12:10

OpenAI为研究长寿推出GPT-4b,联手清华大牛丁胜搞“细胞重编程”,奥特曼本人投资

OpenAI与抗衰老公司Retro Biosciences合作,推出首个专注于生物数据的大模型GPT-4b micro。该模型能够设计出将普通细胞转化为干细胞的蛋白质,目标是将人类寿命延长10年。通过改进山中因子(Yamanaka factors),GPT-4b micro显著提升了细胞重编程效率,效果提升了50倍以上。联合创始人包括清华药学院创始院长丁胜和加州理工科学家Joe Betts-LaCroix。目前,模型尚未对外开放,但已取得初步成果。

来源:量子位

12:09

DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

DeepSeek即将发布的DeepSeek-R1-Preview在LiveCodeBench基准测试中表现优异,与OpenAI o1的中档推理设置相当。该模型替换了更大规模的基础模型,并帮助LiveCodeBench团队修复了评分系统的bug。此前,DeepSeek宣布R1模型将开源,引发了网友热议,认为2025年的编程将变得更为简单。DeepSeek-R1-Lite-Preview曾表现出自我反思的能力,随着推理长度增加,得分稳步提升。开发者们对未来的开源模型和API充满期待。
12:08

清华人大联手推出Search-o1,大幅提升推理模型准确率!

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1,在博士级别的科学问答、数学、代码等11项评测中,能力显著提升,拿下10个第一。该模型通过自主检索外部知识,解决了推理过程中“知识不足”的问题,使得推理更加可靠。实验结果显示,Search-o1在复杂推理任务和开放域问答基准测试中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。项目已开源,可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源:量子位

11:23

MangaNinja:开源线稿上色工具

MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo。

来源:三花快讯

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作,利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力,加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统,但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作,推动 AI 模型在军事领域的应用。然而,AI 武器化的伦理争议持续发酵,部分公司明确禁止其技术用于伤害人类。未来,生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策,但需在技术创新与伦理规范间寻求平衡。

来源:TechCrunch AI

01:53

TikTok 称正在美国恢复服务

TikTok 在美国恢复服务,凸显 AI 平台在数据安全和跨境运营中的挑战。事件涉及 AI 驱动的内容推荐算法和用户数据分析,强调了全球 AI 应用在政策合规性和技术供应链管理中的复杂性。未来,AI 平台需进一步优化联邦学习等技术,确保数据隐私与跨境合作的平衡,同时探索多模态模型在内容审核和个性化推荐中的创新应用。

来源:TechCrunch AI

01:53

TikTok 恢复在美国的服务

TikTok 在美国的服务中断事件凸显了 AI 技术在跨境数据安全和政策合规中的关键作用。作为依赖 AI 推荐算法的短视频平台,TikTok 的恢复运营依赖于政策明确性和技术基础设施的稳定性。事件反映了 AI 应用在全球化部署中面临的法律风险和算力保障挑战,同时也揭示了 AI 技术在中小企业赋能和用户行为分析中的商业价值。未来,AI 平台的可持续运营将更加依赖于技术创新与政策环境的协同发展。

来源:TechCrunch AI

1月 19日
4 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

11:46

TikTok在美国停止运营

TikTok 在美国下架引发 AI 应用与数据安全讨论。由于美国政府对潜在中国监控的担忧,TikTok 母公司字节跳动面临出售或禁令的选择。事件凸显了 AI 技术在全球化应用中的数据安全挑战,尤其是跨境数据流动与隐私保护问题。同时,TikTok 的推荐算法作为 AI 驱动的核心技术,其商业价值吸引了包括 Perplexity AI 在内的潜在买家。未来,AI 应用的合规性与数据主权将成为全球科技竞争的关键议题。

来源:TechCrunch AI

05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案,旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展,同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战,Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径,推动多模态 AI 技术的进一步发展。

来源:TechCrunch AI

1月 18日
4 条新闻
09:41

电动汽车初创公司Canoo申请破产并停止运营

电动汽车初创公司 Canoo 因资金链断裂申请破产,凸显了 AI 技术在自动驾驶和智能电动汽车领域的商业化挑战。Canoo 曾开发模块化电动汽车平台,采用线控转向等先进技术,并尝试与苹果等科技巨头合作。然而,公司在技术落地、成本控制和商业模式上屡次调整,最终未能实现规模化生产。这一案例反映了 AI 驱动的新兴产业在技术研发与商业落地之间的平衡难题,尤其是在高投入、长周期的自动驾驶领域。

来源:TechCrunch AI

08:09

亚马逊在美国的无人机配送业务因测试设施发生坠机事故而暂停

亚马逊因无人机测试事故暂停 Prime Air 项目,凸显 AI 在自动驾驶和物流领域的应用挑战。事故涉及恶劣天气下的飞行稳定性及多机协同问题,需通过软件更新优化飞行控制算法。该项目旨在实现大规模无人机配送,但面临技术可靠性、安全性和运营效率等多重考验。此次事件反映了 AI 系统在复杂环境中的性能局限,以及强化学习与多模态感知技术在无人机领域的应用潜力与改进空间。

来源:TechCrunch AI

03:58

AI初创公司Character AI在网页上测试游戏

Character AI 正在测试基于其 AI 角色的游戏功能,旨在提升用户参与度。新推出的游戏 Speakeasy 和 War of Words 允许用户与现有角色互动,结合自然语言处理技术,增强娱乐体验。此举标志着 AI 从文本交互向多模态娱乐平台的扩展,展现了 AI 在游戏化应用中的潜力。公司定位为 AI 娱乐平台,强调安全性和用户体验,同时通过游戏化策略延长用户停留时间,日均使用时长达 98 分钟。

来源:TechCrunch AI

03:01

OpenAI 正在借助一家长寿初创公司的帮助延长人类寿命

OpenAI 与长寿科学初创公司 Retro Biosciences 合作开发了定制 AI 模型 GPT-4b micro,专注于蛋白质重编程研究,特别是 Yamanaka 因子,旨在将人类皮肤细胞转化为年轻干细胞。该模型与 Google 的 Alphafold 不同,专注于生物研究领域,标志着 OpenAI 首次涉足定制化生物医学 AI 应用。这一合作展示了 AI 在生命科学中的潜力,特别是在器官构建和细胞再生领域,为未来医疗技术发展提供了新方向。

来源:TechCrunch AI