AI新闻 | 第2页 | goodux 好体验

标签筛选

已选标签:

1月 15日

4 条新闻

05:47

任天堂Switch 2或于本周公布：截至目前的传闻与事实

任天堂Switch 2或于本周公布：截至目前的传闻与事实

Nintendo Switch 2 即将发布，预计将延续前代产品的成功，并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布，但业界猜测新主机可能在图形处理、多模态交互（如磁吸 Joy-Con）和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外，向后兼容性确保了现有用户的平滑过渡，进一步巩固 Nintendo 在游戏市场的地位。

来源：TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中，内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型，强调通过大规模 GPU 资源（64k）提升模型性能。Meta 的目标是打造前沿 AI 模型，超越 Anthropic 和 OpenAI 等闭源竞争对手，同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化，包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示，Llama 3 已在 2024 年与行业领先模型竞争，并计划未来成为最先进的 AI 模型。然而，Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源：TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟，推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片，加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头，但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致，包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品，有望解决 AI 算力扩展中的连接瓶颈，推动 AI 能力提升。

来源：TechCrunch AI

01:49

24岁创业者退出首家公司加入Coinbase，为其新项目筹集300万美元

Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具，嵌入企业现有产品中，提供自动化分类、对账和财务报告功能。通过优化数据层，结合 LLM 技术，Open Ledger 解决了传统会计软件的效率和安全问题，目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资，计划扩展团队并支持百万级用户。

来源：TechCrunch AI

1月 13日

4 条新闻

23:25

穆迪同意收购Cape Analytics，该公司为保险提供商开发地理空间人工智能技术

Moody’s 收购地理空间 AI 初创公司 Cape Analytics，旨在利用其 AI 技术优化保险承保流程。Cape 通过卫星图像和算法提取结构化数据，生成详细的物业信息数据库，为保险公司提供精准风险评估。此次收购反映了保险行业加速 AI 应用的趋势，预计到 2032 年全球 AI 保险市场规模将达 798.6 亿美元。尽管 AI 可能引入偏见，但其在提升理赔效率和整体运营效率方面的潜力推动了行业应用。Cape 的技术结合 Moody’s 的全球资源，有望进一步扩展国际市场，并深化在金融领域的应用。

来源：TechCrunch AI

20:06

更多资金注入AI医疗：Qventus以超4亿美元估值获得1.05亿美元融资

AI 医疗初创公司 Qventus 完成 1.05 亿美元 D 轮融资，估值超 4 亿美元，资金将用于扩展 AI 助手在手术、住院/门诊管理等场景的应用。公司通过机器学习和生成式 AI 技术，优化临床和管理工作流程，提升效率。生成式 AI 的引入增强了处理非结构化数据的能力，支持实时响应临床需求。此次融资凸显了 AI 医疗领域的投资热度，Qventus 客户增长四倍，核心业务增长三倍，接近盈亏平衡。

来源：TechCrunch AI

09:47

Adobe FaceLift：单张照片生成高保真 3D 头部模型

Adobe FaceLift：单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术，仅需一张人脸照片，就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图，然后通过 GS-LRM 重建器生成 3D 高斯样条表示，实现全头新视角的合成。

此外，FaceLift 还能处理视频输入，进行 4D 合成，并与 2D 动画技术结合，实现 3D 面部动画。

从官网的一些交互式案例来看，效果还不错，不过不能放大看，恐怖谷效应拉满了。目前这项技术还没有开源，关注我为你持续跟进。

来源：三花快讯

09:47

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI，支持 Qwen 全系列模型。

模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型，以及 Qwen2.5-Coder-32B-Instruct 编程模型。

Qwen Chat 支持同时对比多个模型，还即将推出网络搜索、图像生成和语音模式，值得期待。

来源：三花快讯

1月 12日

1 条新闻

05:30

研究人员开源Sky-T1，一款训练成本低于450美元的“推理”AI模型

UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview，展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异，训练成本仅 450 美元，显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性，适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性，推动开源推理模型的发展。

来源：TechCrunch AI

1月 11日

2 条新闻

23:00

英伟达的AI帝国：聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起，成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来，其营收和股价大幅增长，并显著加大了对 AI 初创企业的投资。2024 年，Nvidia 参与了 49 轮 AI 公司融资，远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业，以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统，推动大模型、自动驾驶、AI 基础设施等技术的商业化落地，展现了其在 AI 产业链中的核心地位。

来源：TechCrunch AI

01:24

50亿美元直播购物应用、英伟达的发布以及 CES 上最奇特的技术

CES 2025 展示了 AI 技术的多样化应用与创新趋势，包括智能家居设备（如机器人吸尘器）和智能眼镜等消费级产品。Nvidia 的 Project Digits 项目预示了 AI 在边缘计算和实时交互领域的潜力，可能推动未来初创企业的技术突破。尽管部分企业仍处于实验阶段，但 AI 在提升用户体验和优化硬件性能方面的进展显著。此外，Meta 的‘更多言论，更少错误’策略反映了 AI 在内容审核和自然语言处理中的持续优化需求。

来源：TechCrunch AI

1月 10日

6 条新闻

10:11

特斯拉在中国推出新款Model Y

特斯拉发布新款 Model Y，针对亚太市场进行设计更新，重点优化了自动驾驶相关硬件和软件集成。新车采用与 Cybertruck 相似的连续灯条设计，提升了视觉识别系统的兼容性。内饰新增后排触控屏，可能整合了多模态交互功能。此次更新反映了特斯拉在自动驾驶技术上的持续投入，同时通过轻量化设计和悬挂优化，提升了 AI 系统的感知精度和决策效率。特斯拉正加速 AI 技术在汽车领域的商业化落地，以应对日益激烈的市场竞争。

来源：TechCrunch AI

09:54

Dify v1.0.0-beta 发布：全新 Marketplace 和插件系统上线

Dify v1.0.0-beta 发布：全新 Marketplace 和插件系统上线

Dify Marketplace 发布了 v1.0.0-beta 版本，带来了全新的插件系统。现在，模型和工具等都成为了插件系统的一部分，用户可以更方便地扩展和定制功能。好久没关注 Dify 了，终于快要正式版了！

来源：三花快讯

09:54

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头（肖像动画）技术，能让静态肖像在各种场景下动起来，而且动作自然、画面逼真。它不仅能处理正面肖像，还能应对各种角度和姿态，甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比，Hallo3 在生成动态场景和沉浸式背景方面有了显著提升，让肖像动画不再局限于简单的表情变化，而是能将角色也融入到场景中。

来源：三花快讯

08:52

希波克拉底人工智能筹集1.41亿美元用于创建面向患者的AI代理

Hippocratic AI 完成 1.41 亿美元 B 轮融资，估值达 16.4 亿美元，专注于开发面向患者的非诊断性 AI 解决方案。该公司通过生成式 AI 技术，创建能够执行术前准备、远程患者监控等任务的智能代理，缓解医疗专业人员短缺问题。其技术核心在于利用大语言模型和强化学习优化医疗流程，目前已与 23 家医疗系统和保险公司达成合作。未来，Hippocratic AI 计划扩展国际市场，推动 AI 在医疗领域的规模化应用。

来源：TechCrunch AI

08:31

英伟达的AI头像出现在我的电脑屏幕上，让我感到十分诡异

英伟达的AI头像出现在我的电脑屏幕上，让我感到十分诡异

Nvidia 在 CES 2025 上推出桌面 AI 助手 R2X，结合生成式游戏技术与大语言模型（如 GPT-4o 和 Grok），提供多模态交互能力。R2X 支持文本、语音输入，可处理文件、实时屏幕分析，并集成检索增强生成（RAG）技术。尽管原型存在视觉和功能缺陷（如屏幕识别错误），Nvidia 计划 2025 年上半年开源该技术，推动开发者生态。R2X 展示了 AI 助手在桌面应用中的潜力，但也凸显了多模态模型在实时交互和准确性上的技术挑战。

来源：TechCrunch AI

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能，通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术，将用户兴趣转化为 5 分钟音频摘要，并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似，均通过 AI 虚拟主持人生成内容，展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放，标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源：TechCrunch AI

1月 9日

3 条新闻

21:27

Rounded是一个AI编排平台，让任何人都能构建AI语音代理

法国初创公司 Rounded 开发了一个 AI 语音代理编排平台，允许企业构建定制化语音代理。其核心是通过整合语音转文本、大语言模型（如 GPT-4）和文本转语音技术，优化特定场景的语音交互体验。Rounded 已在医疗领域推出 AI 语音代理 Donna，用于麻醉师预约管理，显著提升了通话效率和响应速度（延迟降至 600 毫秒）。该平台支持企业选择不同 AI 模型，并通过提示工程优化代理性能，展现了 AI 语音技术在垂直领域的商业化潜力。

来源：TechCrunch AI

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok，扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能，尤其在图像生成领域表现出色，支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问，进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源：TechCrunch AI

09:14

字节跳动开源 S T A R 视频超分模型：利用 T2V 技术实现高清修复

字节跳动开源 S T A R 视频超分模型：利用 T2V 技术实现高清修复

S T A R 是字节跳动开源的一个利用 T2V（Text-to-Video）模型对视频进行超分辨率的方法。无论是 AI 生成的视频还是现实中的视频，S T A R 都能进行高清修复。预训练模型（基于 I2VGen-XL 和 CogVideoX-5B）及推理代码现已发布，有兴趣的佬友可以自己试试。

来源：三花快讯