AI新闻 | goodux 好体验

标签筛选

已选标签:

1月 21日

3 条新闻

06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具，旨在通过自主执行任务（如编写代码、预订旅行）提升用户效率。该工具基于 OpenAI CUA（计算机使用代理）模型，在 WebVoyager 等基准测试中表现优异，但在复杂任务（如创建比特币钱包）上成功率较低。尽管面临安全性和可靠性挑战，OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局，AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源：TechCrunch AI

06:28

朋友推迟其AI伴侶吊坠的发货

AI 初创公司 Friend 推迟其 99 美元的 AI 项链发货至 Q3，该产品旨在作为数字伴侣。公司 CEO 表示需进一步优化设计，预计 2 月底完成原型后进入最终生产阶段。Friend 此前通过 Friend.com 推出 AI 聊天机器人实验，但因生成内容引发争议，现已决定停止该服务，专注于硬件开发。AI 伴侣技术引发伦理争议，专家担忧其可能加剧社交孤立并产生有害内容。

来源：TechCrunch AI

01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1，声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数，支持自我事实核查，适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本，最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势，但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧，凸显中美在AI领域的竞争态势。

来源：TechCrunch AI

1月 20日

7 条新闻

13:49

通义：一分钟生成互动2D卡通角色，Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐，尤其受年轻观众欢迎。尽管3D技术发展迅速，但Live2D格式的2D卡通角色因其高效、轻量的特点，提供了模拟3D运动的动画效果，无需构建完整的3D模型。最新推出的Textoon方法，基于文本描述生成多样化的2D卡通角色，利用先进的语言和视觉模型，快速生成生动互动的角色，显著提升了创作效率与多样性。

来源：github

12:10

OpenAI为研究长寿推出GPT-4b，联手清华大牛丁胜搞“细胞重编程”，奥特曼本人投资

OpenAI与抗衰老公司Retro Biosciences合作，推出首个专注于生物数据的大模型GPT-4b micro。该模型能够设计出将普通细胞转化为干细胞的蛋白质，目标是将人类寿命延长10年。通过改进山中因子（Yamanaka factors），GPT-4b micro显著提升了细胞重编程效率，效果提升了50倍以上。联合创始人包括清华药学院创始院长丁胜和加州理工科学家Joe Betts-LaCroix。目前，模型尚未对外开放，但已取得初步成果。

来源：量子位

12:09

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

DeepSeek即将发布的DeepSeek-R1-Preview在LiveCodeBench基准测试中表现优异，与OpenAI o1的中档推理设置相当。该模型替换了更大规模的基础模型，并帮助LiveCodeBench团队修复了评分系统的bug。此前，DeepSeek宣布R1模型将开源，引发了网友热议，认为2025年的编程将变得更为简单。DeepSeek-R1-Lite-Preview曾表现出自我反思的能力，随着推理长度增加，得分稳步提升。开发者们对未来的开源模型和API充满期待。

来源：量子位 | 公众号 QbitAI

12:08

清华人大联手推出Search-o1，大幅提升推理模型准确率！

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1，在博士级别的科学问答、数学、代码等11项评测中，能力显著提升，拿下10个第一。该模型通过自主检索外部知识，解决了推理过程中“知识不足”的问题，使得推理更加可靠。实验结果显示，Search-o1在复杂推理任务和开放域问答基准测试中表现优异，尤其在多跳QA任务上平均准确率提升了近30%。项目已开源，可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源：量子位

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作，利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力，加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统，但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作，推动 AI 模型在军事领域的应用。然而，AI 武器化的伦理争议持续发酵，部分公司明确禁止其技术用于伤害人类。未来，生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策，但需在技术创新与伦理规范间寻求平衡。

来源：TechCrunch AI

01:53

TikTok 称正在美国恢复服务

TikTok 在美国恢复服务，凸显 AI 平台在数据安全和跨境运营中的挑战。事件涉及 AI 驱动的内容推荐算法和用户数据分析，强调了全球 AI 应用在政策合规性和技术供应链管理中的复杂性。未来，AI 平台需进一步优化联邦学习等技术，确保数据隐私与跨境合作的平衡，同时探索多模态模型在内容审核和个性化推荐中的创新应用。

来源：TechCrunch AI

01:53

TikTok 恢复在美国的服务

TikTok 在美国的服务中断事件凸显了 AI 技术在跨境数据安全和政策合规中的关键作用。作为依赖 AI 推荐算法的短视频平台，TikTok 的恢复运营依赖于政策明确性和技术基础设施的稳定性。事件反映了 AI 应用在全球化部署中面临的法律风险和算力保障挑战，同时也揭示了 AI 技术在中小企业赋能和用户行为分析中的商业价值。未来，AI 平台的可持续运营将更加依赖于技术创新与政策环境的协同发展。

来源：TechCrunch AI

1月 19日

4 条新闻

23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明，尽管大语言模型（LLMs）在编程等任务中表现出色，但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型，发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时，倾向于从显性数据中推断，难以检索到更隐晦的历史知识。此外，模型在特定地区（如撒哈拉以南非洲）的表现较差，暗示训练数据可能存在偏差。研究指出，LLMs 在历史研究领域仍需改进，但未来有望辅助历史学家，特别是在扩展数据覆盖和增加问题复杂性方面。

来源：TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用，包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战，尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境，同时推动联邦学习等隐私保护技术的发展。

来源：TechCrunch AI

11:46

TikTok在美国停止运营

TikTok 在美国下架引发 AI 应用与数据安全讨论。由于美国政府对潜在中国监控的担忧，TikTok 母公司字节跳动面临出售或禁令的选择。事件凸显了 AI 技术在全球化应用中的数据安全挑战，尤其是跨境数据流动与隐私保护问题。同时，TikTok 的推荐算法作为 AI 驱动的核心技术，其商业价值吸引了包括 Perplexity AI 在内的潜在买家。未来，AI 应用的合规性与数据主权将成为全球科技竞争的关键议题。

来源：TechCrunch AI

05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案，旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展，同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战，Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径，推动多模态 AI 技术的进一步发展。

来源：TechCrunch AI

1月 18日

3 条新闻

09:41

电动汽车初创公司Canoo申请破产并停止运营

电动汽车初创公司 Canoo 因资金链断裂申请破产，凸显了 AI 技术在自动驾驶和智能电动汽车领域的商业化挑战。Canoo 曾开发模块化电动汽车平台，采用线控转向等先进技术，并尝试与苹果等科技巨头合作。然而，公司在技术落地、成本控制和商业模式上屡次调整，最终未能实现规模化生产。这一案例反映了 AI 驱动的新兴产业在技术研发与商业落地之间的平衡难题，尤其是在高投入、长周期的自动驾驶领域。

来源：TechCrunch AI

08:09

亚马逊在美国的无人机配送业务因测试设施发生坠机事故而暂停

亚马逊因无人机测试事故暂停 Prime Air 项目，凸显 AI 在自动驾驶和物流领域的应用挑战。事故涉及恶劣天气下的飞行稳定性及多机协同问题，需通过软件更新优化飞行控制算法。该项目旨在实现大规模无人机配送，但面临技术可靠性、安全性和运营效率等多重考验。此次事件反映了 AI 系统在复杂环境中的性能局限，以及强化学习与多模态感知技术在无人机领域的应用潜力与改进空间。

来源：TechCrunch AI

03:01

OpenAI 正在借助一家长寿初创公司的帮助延长人类寿命

OpenAI 与长寿科学初创公司 Retro Biosciences 合作开发了定制 AI 模型 GPT-4b micro，专注于蛋白质重编程研究，特别是 Yamanaka 因子，旨在将人类皮肤细胞转化为年轻干细胞。该模型与 Google 的 Alphafold 不同，专注于生物研究领域，标志着 OpenAI 首次涉足定制化生物医学 AI 应用。这一合作展示了 AI 在生命科学中的潜力，特别是在器官构建和细胞再生领域，为未来医疗技术发展提供了新方向。

来源：TechCrunch AI

1月 17日

3 条新闻

23:55

2亿美元的猛犸象和告别TikTok

本期 TechCrunch Equity 播客探讨了 AI 在招聘领域的创新应用，如 Maki 和 Synthesia 利用 AI 优化招聘流程。同时，节目分析了 AI 伴侣的潜在风险，包括用户与 ChatGPT 等 AI 工具的情感依赖问题。此外，Colossal Biosciences 的融资案例展示了 AI 在生物科技领域的潜力。这些讨论反映了 AI 在应用场景扩展、伦理挑战和技术创新方面的最新趋势。

来源：TechCrunch AI

17:58

Nord Security创始人推出Nexos.ai，助力企业将AI项目从试点推向生产

Nexos.ai 由 Nord Security 创始人创立，旨在帮助企业将 AI 项目从试点推向生产，重点关注大语言模型（LLMs）的可视化、安全性和适应性。通过单一 API，客户可访问 200 多个 AI 模型，支持在模型故障或成本过高时自动切换。Nexos.ai 引入智能缓存和严格的数据安全措施，优化成本并确保合规性。该平台解决了企业在 AI 部署中的高可用性、安全性和成本管理挑战，助力企业高效管理复杂的 AI 模型生态系统。

来源：TechCrunch AI

10:45

苹果将商店应用程序引入印度市场

Apple 在印度推出 Apple Store 应用，利用 AI 技术提供个性化购物推荐和产品定制服务。该应用通过深度学习算法分析用户行为，优化购物体验，并支持多语言交互。此举标志着 Apple 在印度市场的 AI 应用深化，结合本地化需求，推动智能零售和个性化服务的发展。同时，Apple 在印度的制造扩展也为其 AI 驱动的供应链优化提供了数据支持。

来源：TechCrunch AI

1
2
3
…
8
下一页 »