AI新闻 | 第5页 | goodux 好体验

标签筛选

已选标签:

12月 31日

9 条新闻

00:00

趣丸科技「天谱乐」开创AI音乐新纪元：全球首个多模态配乐大模型

趣丸科技推出的全球首个多模态配乐大模型“天谱乐”，支持文本、图片和视频生曲，能生成高度匹配的BGM和MV效果。该技术在中文人声唱词上达到专业级效果，减少了电音感，接近音乐发行级别。“天谱乐”已接入唱鸭App，累计创作近1000万首AI歌曲。
来源：AI工具集

来源：AI工具集

00:00

华佗 GPT-o1：专为医学推理设计的开源 LLM

华佗 GPT-o1：专为医学推理设计的开源 LLM

华佗 GPT-o1 是香港中文大学深圳分校推出的专为医学推理设计的医学 LLM。基于 Qwen2.5 的版本支持中英文双语，并且完全开源，包括数据集。当然，如果你更喜欢纯英文模型，也有基于 LLaMA-3.1 的版本，可以使用 vllm 或 Sglang 等工具进行部署。

来源：三花快讯

00:00

字节跳动似乎在规避美国限制购买英伟达芯片

字节跳动计划在2025年斥资70亿美元购买英伟达芯片，以支持其AI业务发展，包括其热门AI聊天机器人“豆包”。尽管美国对中国实施AI芯片出口限制，字节跳动通过将芯片存储于东南亚数据中心规避了直接限制。此举凸显了全球AI竞赛中算力的重要性，以及企业在应对政策限制时的创新策略。字节跳动的投资将加速其在生成式AI、大语言模型等领域的研发，进一步推动AI技术在智能助手等应用场景的落地。

来源：TechCrunch AI

00:00

Bench在突然关闭后将被收购

Bench在突然关闭后将被收购

AI 驱动的会计平台 Bench 在突然关闭后被 HR 科技公司 Employer.com 收购，凸显了 AI 技术在金融科技领域的应用挑战。Bench 曾服务于超过 12,000 家小型企业，其平台依赖 AI 技术进行自动化会计和税务管理。此次收购将重启 Bench 的 AI 服务，并探索与 Employer.com 的 HR 技术整合，可能推动 AI 在财务和人力资源领域的多模态融合。然而，数据安全、服务连续性和客户信任成为关键挑战，反映了 AI 商业落地中的复杂性和技术伦理问题。

来源：TechCrunch AI

00:00

全国首家人工智能艺术学院在天津成立，2025年开始招研究生

12月30日，天津美术学院成立全国首个专门的人工智能艺术学院，旨在探索AI与艺术的深度融合。该学院将开设数据艺术、生成艺术等4个研究生方向，2025年9月开始招生，计划招收20余人。学院还将优化通识课程，助力天津文旅发展，并与多家单位合作，推动产教融合，培养具有国际视野和创新思维的艺术人才。

来源：天津日报

00:00

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君在3个月内第三次开源，推出全球首个基于全域真实场景、全能硬件平台的机器人数据集AgiBot World。该项目由智元机器人联合上海AI Lab等机构发布，涵盖80余种日常生活技能，数据规模比现有数据集高出10倍，场景覆盖面扩大100倍，质量达到工业级标准。数据集包含家居、餐饮、工业等多个核心场景，支持机器人完成复杂任务如插内存条、整理洗碗机和双臂协作搬运等。GitHub和抱抱脸已开放下载。

来源：量子位

00:00

AI Game DevTools：一站式 AI 游戏开发资源导航

AI Game DevTools 是一份精心收集的与 AI 游戏开发相关的项目导航，涵盖了大模型、Agent、3D 资源、视频、动画等多个领域。作者们贴心地为所有工具列出了来源、简介、论文以及适用的游戏引擎，简直是游戏开发者的福音！如果你正在做游戏开发，不妨看看这些工具，说不定对你有帮助嗷。

来源：三花快讯

00:00

可灵AI API新增【虚拟试穿V1.5】和【对口型】

快手可灵AI（Kling）宣布API能力升级，推出虚拟试穿V1.5模型，支持单件及组合服装输入，能生成试衣视频。同时，新增对口型功能，可实现视频中人物口型与配音同步，提升视频真实感。这些升级将为电商、广告营销和泛娱乐行业带来新机遇，推动业务增长。
来源：可灵AI

来源：AI工具集

00:00

大模型的2024年：我们对AI的发展脱敏了

2024年AI领域发展迅速，大模型更实用但不再惊艳，端侧模型和混合专家技术（MoE）降低成本，多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行，AI Agent开发门槛降低。AI硬件百花齐放，AI眼镜异军突起。AI游戏从辅助工具成为游戏一部分。中国AI人才梯队规模质量仅次于美国，期待在AI浪潮中领先。
来源：新硅NewGeek

来源：AI工具集

12月 30日

8 条新闻

00:00

商汤科技推出 Large Motion Model：统一多模态运动生成大模型

商汤科技推出 Large Motion Model：统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心，构建了一个多模态框架，将主流运动生成任务整合为一个通用模型。

用户只需输入描述，即可生成一段运动姿势视频。目前，该模型已完全开源，支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源：三花快讯

00:00

智谱开源 CogAgent-9B-20241220：提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型，类似于 Claude Computer use，在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外，CogAgent 能够处理中英文双语的屏幕截图和语言交互，极大地扩展了其应用范围。官方演示中，展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过，目前的操作速度还比较慢，且需要提前为 AI 打开相关窗口，在 AI 操作过程中人类无法介入。

来源：三花快讯

00:00

Aria-UI：领先的 GUI 多模态模型，AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型，类似于 Claude Computer use。它无需 HTML 或 AXTree 输入，采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示，确实速度挺快的，不过该技术是底层模型，没有封装成可交互的应用。

来源：三花快讯

00:00

爱诗科技PixVerse V3.5上线：5秒生成高清视频，动漫效果大幅提升

爱诗科技PixVerse V3.5上线：5秒生成高清视频，动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线，带来显著性能提升和新功能。新版本可在5秒内生成视频，增强运动控制力，支持多种动漫风格切换，满足个性化需求。视频质量提升至1080p高清，并实现首尾帧丝滑过渡，提升整体观感。此前，爱诗科技完成近3亿元A+轮融资，资金将用于技术研发、扩展算力及人才团队建设。

来源：AI Base

00:00

支付宝「探一下」新一代AI视觉搜索产品，满足你的好奇心

支付宝推出新功能“探一下”，基于自研的多模态大模型技术，能够“用AI之眼探索万物”，提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务：探知识、探灵感、探文本。可以根据自己的需求选择相应的服务，满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源：支付宝

来源：AI工具集

00:00

非洲最新的金融科技独角兽公司通过脚踏实地取得胜利

非洲最新的金融科技独角兽公司通过脚踏实地取得胜利

非洲金融科技独角兽 TymeBank 和 Moniepoint 通过混合数字与实体触点的创新模式，成功扩展了在低银行渗透率市场的服务。TymeBank 利用超市合作和自助服务终端，结合人工大使，为零售和小企业客户提供便捷的银行服务；Moniepoint 则通过账户、支付和贷款工具支持小企业，并逐步扩展至零售银行。这种‘控制论’方法通过技术增强非正式渠道，而非完全数字化，适应了非洲现金主导、互联网连接不稳定的市场环境。AI 技术在优化客户获取、增强信任和提升服务效率方面发挥了关键作用，展示了金融科技在复杂市场中的创新潜力。

来源：TechCrunch AI

00:00

智元机器人开源 AgiBot World 百万真机数据集，大幅超越谷歌 Open X-Embodiment

智元机器人宣布开源全球首个百万真机数据集AgiBot World，超越谷歌Open X-Embodiment。该数据集基于全域真实场景、全能硬件平台、全程质量把控，覆盖家居、餐饮、工业等五大核心场景，包含80多种技能视频。
来源：AI工具集

来源：AI工具集

00:00

拓元智慧完成近亿元Pre-A轮融资，将聚焦多模态大模型与具身智能技术

拓元智慧（X-Era AI）宣布完成近亿元人民币的Pre-A轮融资，由粤科金融集团、鹏城愿景基金等投资。资金将用于加速多模态大模型和具身智能技术的研发。公司成立三年，累计营收近亿元，核心团队来自国内外高校和知名企业，已在无人零售、文教创作等领域实现技术深度应用。
来源：钛媒体

来源：AI工具集

12月 29日

3 条新闻

00:00

谷歌CEO表示，AI模型Gemini将是公司2025年的“最大重点”

Google CEO Sundar Pichai 强调 2025 年将是公司 AI 发展的关键年，重点在于加速 Gemini 模型的规模化应用，特别是在消费者领域。Pichai 承认 Google 在 AI 领域仍需追赶，并指出 Gemini 虽具备强劲势头，但需在 2025 年进一步缩小差距，确立领导地位。这一战略反映了科技巨头在 AI 领域的激烈竞争，以及大语言模型在商业落地和技术创新中的核心作用。

来源：TechCrunch AI

00:00

最佳iPad应用程序，释放并探索你的创造力

本文介绍了多款 iPad 创意应用，重点展示了 AI 技术在数字艺术、视频编辑和图形设计领域的创新应用。Canva 的 AI 功能如“Magic Switch”和“Magic Media”显著简化了内容创作流程，体现了多模态模型在图像生成和编辑中的潜力。Procreate 和 LumaFusion 则通过智能辅助工具（如 QuickShape、StreamLine 和音频优化）提升了创作效率和用户体验。这些应用不仅展示了 AI 在创意产业中的广泛应用，也反映了边缘计算和用户友好型 AI 工具的发展趋势，为未来更多 AI 驱动的创意解决方案奠定了基础。

来源：TechCrunch AI

00:00

如何观看2025年CES新闻发布会

CES 2025 聚焦 AI 技术前沿，NVIDIA、AMD 等巨头将展示最新突破。NVIDIA 凭借其在 AI 芯片领域的领先地位，预计将发布 RTX 5000 系列，进一步推动 AI 算力提升。AMD 则计划推出 RDNA 4 架构的 RX 8000/9000 系列 GPU，与 NVIDIA 展开竞争。三星以“AI for All: Everyday, Everywhere”为主题，展示其在消费电子和机器人领域的 AI 应用。CES 2025 将揭示 AI 技术在硬件创新、多模态融合及商业落地方面的最新趋势，推动 AI 产业生态的持续发展。

来源：TechCrunch AI

« 上一页
1
…
3
4
5