AI新闻 | 第3页 | goodux 好体验

标签筛选

已选标签:

12月 31日

8 条新闻

00:00

大模型的2024年：我们对AI的发展脱敏了

2024年AI领域发展迅速，大模型更实用但不再惊艳，端侧模型和混合专家技术（MoE）降低成本，多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行，AI Agent开发门槛降低。AI硬件百花齐放，AI眼镜异军突起。AI游戏从辅助工具成为游戏一部分。中国AI人才梯队规模质量仅次于美国，期待在AI浪潮中领先。
来源：新硅NewGeek

来源：AI工具集

00:00

智谱正式发布深度推理模型：GLM-Zero 的初代版本 GLM-Zero-Preview

智谱AI在2024年尾发布 GLM-Zero 推理模型，初代版本GLM-Zero-Preview已上线，基于扩展强化学习技术，提升数理逻辑、代码处理和深度推理能力。模型在AIME 2024、MATH500和LiveCodeBench评测中表现优异，与OpenAI-o1-Preview相当。用户可在智谱清言-“Zero推理模型”智能体免费使用，开发者可通过API调用体验。
来源：AI工具集

来源：AI工具集

00:00

AI Game DevTools：一站式 AI 游戏开发资源导航

AI Game DevTools 是一份精心收集的与 AI 游戏开发相关的项目导航，涵盖了大模型、Agent、3D 资源、视频、动画等多个领域。作者们贴心地为所有工具列出了来源、简介、论文以及适用的游戏引擎，简直是游戏开发者的福音！如果你正在做游戏开发，不妨看看这些工具，说不定对你有帮助嗷。

来源：三花快讯

00:00

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君在3个月内第三次开源，推出全球首个基于全域真实场景、全能硬件平台的机器人数据集AgiBot World。该项目由智元机器人联合上海AI Lab等机构发布，涵盖80余种日常生活技能，数据规模比现有数据集高出10倍，场景覆盖面扩大100倍，质量达到工业级标准。数据集包含家居、餐饮、工业等多个核心场景，支持机器人完成复杂任务如插内存条、整理洗碗机和双臂协作搬运等。GitHub和抱抱脸已开放下载。

来源：量子位

00:00

OpenAI 新模型 o1 如何主动推理安全规则，提升 AI 安全性

OpenAI 新模型 o1 如何主动推理安全规则，提升 AI 安全性

OpenAI 推出的新 o 系列模型能够理解并积极推理特定的安全指南，不再依赖示例学习。o1 模型通过三个阶段的训练，显著提升了安全性，在拒绝有害请求和准确性方面优于其他主流系统。然而，黑客仍能操纵新模型，显示了控制复杂 AI 系统的难度。OpenAI 有约100名员工专注于 AI 安全，强调与人类价值观对齐的重要性。

来源：AI 基地

00:00

从AI代理到企业预算，20位风险投资家分享他们对2025年企业技术的预测

2025年企业AI应用展望：尽管AI被视为工业革命以来最大的技术突破，企业采用速度仍较慢。专家预测，随着高质量数据需求的增加，AI将从实验阶段转向大规模部署。重点关注领域包括：AI代码代理用于应用现代化、高成本行业自动化（如会计和法律服务）、以及企业销售周期和定价模型的变化。投资趋势聚焦于企业韧性、数据主权服务和任务特定模型。技术发展将探索替代Transformer的解决方案，以减少LLM训练和生产的计算需求。企业技术价值将从单纯驱动收入或降低成本，转向同时减少业务摩擦。

来源：TechCrunch AI

00:00

Switti：生成速度超快的文本生成图像模型

Switti 是一个生成速度超快的文本生成图像模型，其性能优于现有的自回归模型，媲美现有的扩散模型，同时生成速度最高快7倍。

Switti 的论文早在5月份就已发布，近日，其模型终于开源，能够生成1024*1024的图片，速度超级快。你可以在在线演示中亲自感受其超快的生成速度。

来源：三花快讯

00:00

全国首家人工智能艺术学院在天津成立，2025年开始招研究生

12月30日，天津美术学院成立全国首个专门的人工智能艺术学院，旨在探索AI与艺术的深度融合。该学院将开设数据艺术、生成艺术等4个研究生方向，2025年9月开始招生，计划招收20余人。学院还将优化通识课程，助力天津文旅发展，并与多家单位合作，推动产教融合，培养具有国际视野和创新思维的艺术人才。

来源：天津日报

12月 30日

6 条新闻

00:00

Aria-UI：领先的 GUI 多模态模型，AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型，类似于 Claude Computer use。它无需 HTML 或 AXTree 输入，采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示，确实速度挺快的，不过该技术是底层模型，没有封装成可交互的应用。

来源：三花快讯

00:00

获得a16z和QED支持的巴西初创公司Carecode将AI代理应用于医疗保健领域

巴西初创公司 Carecode 利用 AI 代理优化医疗预约前后的任务，如预约安排和确认，显著降低医疗成本并提升效率。其 AI 系统通过 WhatsApp 支持文本和语音消息，适应巴西用户习惯，尤其针对老年和低收入群体。Carecode 的垂直聚焦策略使其在医疗领域构建竞争壁垒，未来可能扩展至保险、支付等相关领域。该技术展示了 AI 在医疗辅助任务中的潜力，特别是在降低运营成本和提升用户体验方面的创新应用。

来源：TechCrunch AI

00:00

智元机器人开源 AgiBot World 百万真机数据集，大幅超越谷歌 Open X-Embodiment

智元机器人宣布开源全球首个百万真机数据集AgiBot World，超越谷歌Open X-Embodiment。该数据集基于全域真实场景、全能硬件平台、全程质量把控，覆盖家居、餐饮、工业等五大核心场景，包含80多种技能视频。
来源：AI工具集

来源：AI工具集

00:00

支付宝「探一下」新一代AI视觉搜索产品，满足你的好奇心

支付宝推出新功能“探一下”，基于自研的多模态大模型技术，能够“用AI之眼探索万物”，提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务：探知识、探灵感、探文本。可以根据自己的需求选择相应的服务，满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源：支付宝

来源：AI工具集

00:00

智谱开源 CogAgent-9B-20241220：提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型，类似于 Claude Computer use，在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外，CogAgent 能够处理中英文双语的屏幕截图和语言交互，极大地扩展了其应用范围。官方演示中，展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过，目前的操作速度还比较慢，且需要提前为 AI 打开相关窗口，在 AI 操作过程中人类无法介入。

来源：三花快讯

00:00

英伟达的下一步：为类人机器人提供动力

Nvidia 宣布将于 2025 年上半年推出新一代紧凑型计算机 Jetson Thor，专为人形机器人设计。这一举措标志着 Nvidia 在机器人领域的深入布局，旨在为全球数十万机器人制造商提供底层技术支持。Nvidia 副总裁 Deepu Talla 指出，这一战略得益于生成式 AI 模型的爆发式增长，以及利用模拟环境训练机器人的能力。此举也反映了 Nvidia 在 AI 芯片市场竞争加剧的背景下，通过机器人技术拓展业务版图的战略意图。

来源：TechCrunch AI

12月 29日

2 条新闻

00:00

最佳iPad应用程序，释放并探索你的创造力

本文介绍了多款 iPad 创意应用，重点展示了 AI 技术在数字艺术、视频编辑和图形设计领域的创新应用。Canva 的 AI 功能如“Magic Switch”和“Magic Media”显著简化了内容创作流程，体现了多模态模型在图像生成和编辑中的潜力。Procreate 和 LumaFusion 则通过智能辅助工具（如 QuickShape、StreamLine 和音频优化）提升了创作效率和用户体验。这些应用不仅展示了 AI 在创意产业中的广泛应用，也反映了边缘计算和用户友好型 AI 工具的发展趋势，为未来更多 AI 驱动的创意解决方案奠定了基础。

来源：TechCrunch AI

00:00

Joco 曾差点在推出时夭折，如今已成为电动自行车配送员的生命线——以及一项盈利的业务

Joco 是一家专注于电动自行车共享和最后一英里配送的初创公司，通过 AI 驱动的车队管理技术优化运营效率。其核心创新包括智能充电柜和电池管理系统，解决了城市中因不安全充电引发的电池火灾问题。Joco 的 AI 技术不仅提升了配送效率，还通过数据分析优化车辆调度和维护，降低了运营成本。未来，Joco 计划将 AI 技术扩展至国际市场，进一步推动电动交通工具的智能化管理。

来源：TechCrunch AI