AI新闻 | 第3页 | goodux 好体验

标签筛选

已选标签:

1月 9日

9 条新闻

09:14

Adobe 发布 TransPixar：生成透明背景视频的创新技术

TransPixar 是 Adobe 最新发布的一项创新技术，能够通过文本和图像生成透明背景的视频。

不仅支持创建烟雾和反射等透明元素，还提供了高度逼真的视觉效果。可以看看演示视频，效果相当不错。也可以在 Hugging Face 体验在线版本，不过在线版限制了帧率和推理步骤。代码是开源的，有兴趣的可以直接本地部署。

来源：三花快讯

09:14

SAI 开源 SPAR3D：一秒内从单图生成可编辑 3D 模型

SPAR3D 是 SAI 最近开源的一项图生 3D 技术，能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非商业用途均免费开放，只要年收入小于 100 万美元即可使用。目前，代码和模型都已经公开发布。

来源：三花快讯

09:14

NeuralSVG：文本生成可编辑矢量图形的创新工具

NeuralSVG：文本生成可编辑矢量图形的创新工具

NeuralSVG 是一款创新的工具，能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出，NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色，生成的 SVG 文件不仅结构清晰，还支持分层编辑，极大地方便了设计师和开发者。目前，NeuralSVG 尚未开源，但我会持续跟进最新动态，第一时间为大家带来更新。关注我，不错过任何重要信息！

来源：三花快讯

06:10

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

Halliday 在 CES 2025 推出的智能眼镜通过 DigiWindow 技术，将 3.5 英寸圆形显示屏直接投射到用户视野中，支持实时语言翻译、手机通知显示及 AI 助手功能。该设备采用轻量化设计，无需昂贵 AR 镜片，支持处方镜片，定价 489 美元。其核心技术结合了多模态 AI 模型，支持 40 种语言的实时翻译，并计划集成主动式 AI 助手。尽管 DigiWindow 的定位仍需优化，但其轻便、低延迟的特点展示了智能眼镜在 AI 助手、多模态交互等领域的潜力，为未来可穿戴设备的 AI 应用提供了新方向。

来源：TechCrunch AI

05:33

Grok可能很快会推出“无拘模式”

xAI 推出的 Grok 聊天机器人即将推出 ‘Unhinged Mode’，旨在提供更具争议性和冒犯性的回答，突破传统 AI 的过滤限制。该模式反映了 Elon Musk 对 AI 的愿景，即打破 ‘政治正确’ 的束缚，提供更直接、未经过滤的对话体验。然而，Grok 目前仍受限于其训练数据（公开网页），导致其在政治敏感话题上表现出左倾倾向。Musk 承诺将调整模型以实现政治中立。这一发展凸显了 AI 在内容生成和伦理规范方面的挑战，特别是在平衡言论自由与社会责任之间的复杂关系。

来源：TechCrunch AI

02:05

本周人工智能：更强大的AI即将到来，但其益处能否均衡分布？

OpenAI CEO Sam Altman 宣布公司已掌握构建通用人工智能（AGI）的技术路径，并开始瞄准超级智能（Superintelligence）。AGI 被定义为在大多数经济价值工作中超越人类的自主系统，而超级智能则可能大幅加速创新。然而，近期研究表明，AI 对自由职业者的影响呈现“拐点效应”：初期提升收入，但后期可能取代工作岗位，如翻译领域收入下降 30%。此外，GPT-4 在金融领域的应用显示，AI 辅助可显著提升专家决策效率。随着 AI 能力提升，如何确保其收益广泛分配成为关键挑战。

来源：TechCrunch AI

01:05

实时更新 CES 2025：英伟达、人工智能、电动汽车发布及更多第二天动态

CES 2025 展示了 AI 技术的多样化应用与创新趋势。Nvidia CEO 强调其系统性能超越摩尔定律，通过全栈创新推动 AI 算力提升。Delta Air Lines 推出 AI 助手，优化用户体验并整合 Uber 服务。AI 在宠物科技领域也取得进展，如 Birdfy 的 AI 鸟类识别系统。此外，Waymo-Zeekr 合作的自动驾驶出租车亮相，突显 AI 在交通领域的突破。整体来看，AI 正加速渗透至消费、交通、娱乐等多个场景，推动产业智能化升级。

来源：TechCrunch AI

00:05

Omi，作为Friend的竞争对手，希望通过AI和“脑机接口”提升你的生产力

旧金山初创公司 Based Hardware 在 CES 2025 上推出 AI 可穿戴设备 Omi，旨在提升生产力。Omi 支持语音激活和脑机接口，通过 GPT-4o 实现对话总结、任务管理和个性化建议。设备采用开源平台，允许用户自定义数据存储和 AI 模型选择，开发者已创建 250+ 应用。Omi 定价 89 美元，预计 2025 年 Q2 发货，开发者版已开放订购。该设备探索了 AI 在可穿戴领域的创新应用，但脑机接口功能尚未完全验证。

来源：TechCrunch AI

00:00

Grove利用人工智能缩短临床试验招募时间

Grove AI 利用生成式 AI 技术，开发语音助手 Grace，显著优化临床试验患者招募流程。通过语音交互进行预筛选，Grace 将注册时间从数周缩短至几分钟，并自动安排现场访问。该技术解决了医疗领域长期存在的官僚主义和系统落后问题，已服务 70,000 名患者，完成 7,000 次预约。Grove AI 近期获得 490 万美元种子轮融资，投资者看好其在 AI 和计算生物学领域的潜力。此外，公司正开发基于 AI 的患者数据管理工具，有望进一步推动医疗数据管理的数字化转型。

来源：TechCrunch AI

1月 8日

1 条新闻

16:17

微软通过公共和私营部门的交易支持其在印度的30亿美元人工智能计划

微软宣布在印度核心领域展开广泛AI合作，计划投资30亿美元，与政府及企业合作推动AI技术应用。重点包括：支持印度AI数据集平台的数据收集与合成生成，培训50万名AI技术人才，建立AI卓越中心及20个AI实验室。合作涵盖铁路、医疗、金融、制造和教育领域，如与RailTel合作推进铁路数字化和AI转型，与Apollo Hospitals开发医疗AI助手，与Bajaj Finance合作实现年成本节约1800万美元。此举旨在与谷歌、亚马逊等竞争，加速AI在印度的商业落地和人才培养，推动多模态AI和边缘计算等技术的应用。

来源：TechCrunch AI

1月 6日

9 条新闻

11:31

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手

罗永浩旗下的 AI 初创项目 Jarvis 近日发布了名为 J1 Assistant 的聚合类 AI 助理软件。目前，该软件仅支持部分安卓机型。用户可以通过长按发送语音至联系人、谷歌搜索引擎、ChatGPT 或创建备忘录。UI 设计颇具锤子科技风格，当前版本为 0.8.3-beta1。感兴趣的朋友可以在J1 Assistant 官网(https://matter.ai/)下载体验。

来源：三花快讯

11:26

阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 推出了 CodeElo 基准测试，利用 Elo 评级系统评估大语言模型（LLM）的编程能力。CodeElo 通过 CodeForces 平台的题目进行测试，确保评估的准确性和全面性。在测试中，OpenAI 的 o1-mini 模型表现最佳，Elo 评分为 1578，超过了 90% 的人类程序员。
来源：AI工具集

来源：AI工具集

11:26

「天工大模型4.0」o1版和4o版正式上线天工APP和网页，免费使用

昆仑万维集团宣布，「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP，供用户免费使用。o1版专注于中文逻辑推理，具备强大的数学、代码、逻辑、常识和伦理决策能力，通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型，语音对话助手Skyo具有情感表达和多语言切换能力，提供流畅的实时对话体验。
来源：昆仑万维集团

来源：AI工具集

11:26

马斯克称 Grok 3 即将推出：已完成预训练，计算量比 Grok 2 高十倍

马斯克宣布 Grok 3 即将推出，预训练已完成，计算量比 Grok 2 高出十倍。去年 7 月，Grok 3 使用了 10 万块英伟达 H100 芯片进行训练，但未能如期发布。去年 12 月，xAI 向所有 𝕏 平台用户免费推出了 Grok-2 模型，Premium 用户将优先访问新功能。
来源：IT之家

来源：AI工具集

10:35

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型，采用隐式扩散模型实现自监督层级化妆迁移，已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型，已开源并验证可正常训练和推理。此外，团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接：https://github.com/Snowfallingplum/SHMT

来源：GitHub

08:56

萨姆·阿尔特曼对解雇他的OpenAI董事会成员有话要说

OpenAI CEO Sam Altman 在采访中透露了公司未来技术发展方向，包括芯片计划和大语言模型 ChatGPT 的定价策略。这一事件凸显了 AI 企业在技术研发与商业化落地中的关键挑战，如算力优化、成本控制和商业模式的探索。OpenAI 的技术路线将继续影响大语言模型和多模态 AI 的发展，推动其在智能助手、AI 编程等领域的应用深化。

来源：TechCrunch AI

00:00

TangoFlux：极速文本转音频生成模型

TangoFlux 是一个开源的极速文本转音频（TTA）生成模型，在单个 A40 GPU 上仅需 3.7 秒即可生成 30 秒的 44.1kHz 音频。佬友们可以在线体验看看，速度确实飞快，生成的质量也算还行。

来源：三花快讯

00:00

ebook2audiobook 2.0 发布：全新WebUI与 1000 种语言

ebook2audiobook 2.0 发布：全新WebUI与 1000 种语言

知名开源电子书转有声书项目ebook2audiobook 发布了 2.0 版本。新版本支持本地语音克隆与有声书生成，覆盖了 1000 种语言，并配备了全新的 WebUI 界面。

此外，安装脚本也得到了优化，使用更加便捷。想体验新功能的佬友，可以访问在线版本进行试用。

来源：三花快讯

00:00

Create AI 开源 Ruyi-Mini-7B 图生视频模型，专为消费级 GPU 设计

Create AI （原图森未来）开源了Ruyi-Mini-7B图生视频模型。这款模型专为消费级 GPU 设计，支持生成 360p 和 720p 分辨率、最长 5 秒的视频。

据Create AI官网介绍，Create AI 似乎正在利用大模型技术开发 AAA 级开放世界游戏《金庸群侠传》。

来源：三花快讯

1月 4日

1 条新闻

00:00

生成式人工智能投资在2024年达到新高

2024 年生成式 AI 投资创历史新高，全球融资达 560 亿美元，同比增长 192%。OpenAI、Anthropic、xAI 等头部企业持续获得大额融资并推出创新产品。美国公司占据主导地位，但中国、欧洲等地也有 Moonshot AI、Mistral 等企业获得显著投资。生成式 AI 在编程助手、媒体创作等垂直领域竞争加剧，但技术挑战和高计算成本可能限制中小企业的持续创新。基础设施层企业（如数据中心）受益显著，预计全球 AI 数据中心年支出将达 2500 亿美元。未来，行业可能面临估值泡沫和技术瓶颈的双重挑战。

来源：TechCrunch AI