AI新闻 | 第2页 | goodux 好体验

标签筛选

已选标签:

1月 6日

1 条新闻

00:00

TangoFlux：极速文本转音频生成模型

TangoFlux 是一个开源的极速文本转音频（TTA）生成模型，在单个 A40 GPU 上仅需 3.7 秒即可生成 30 秒的 44.1kHz 音频。佬友们可以在线体验看看，速度确实飞快，生成的质量也算还行。

来源：三花快讯

1月 4日

1 条新闻

00:00

生成式人工智能投资在2024年达到新高

2024 年生成式 AI 投资创历史新高，全球融资达 560 亿美元，同比增长 192%。OpenAI、Anthropic、xAI 等头部企业持续获得大额融资并推出创新产品。美国公司占据主导地位，但中国、欧洲等地也有 Moonshot AI、Mistral 等企业获得显著投资。生成式 AI 在编程助手、媒体创作等垂直领域竞争加剧，但技术挑战和高计算成本可能限制中小企业的持续创新。基础设施层企业（如数据中心）受益显著，预计全球 AI 数据中心年支出将达 2500 亿美元。未来，行业可能面临估值泡沫和技术瓶颈的双重挑战。

来源：TechCrunch AI

1月 2日

1 条新闻

00:00

创新插件VMix：大幅提升生成图像的美学质量

创新插件VMix：大幅提升生成图像的美学质量

字节跳动与中科大团队推出VMix，通过新颖的价值混合交叉注意力机制，显著提升扩散模型生成图像的美学质量。VMix能系统性增强图像的颜色、光线和构图等细节维度，弥合生成图像与现实美学之间的差距。该插件无需重新训练即可应用于社区模型，实验表明其效果优于现有方法，并兼容LoRA、ControlNet等模块。VMix通过分离文本提示中的内容描述和美学描述，优化去噪过程，从而在保持图像与文本对齐的同时，大幅提高视觉表现。

来源：字节跳动 & 中科大

12月 31日

2 条新闻

00:00

OpenAI公布2025年将发布的技术产品：AGI、Agents、GPT-4o升级版

OpenAI首席执行官Sam Altman宣布，到2025年将发布包括AGI（通用人工智能）、智能体Agents、GPT-4o升级版在内的多项技术产品，以及其他改进，如更好的记忆存储、上下文窗口、成人模式、深度研究特色功能、Sora和个性化定制。
来源：第一财经

来源：AI工具集

00:00

Switti：生成速度超快的文本生成图像模型

Switti 是一个生成速度超快的文本生成图像模型，其性能优于现有的自回归模型，媲美现有的扩散模型，同时生成速度最高快7倍。

Switti 的论文早在5月份就已发布，近日，其模型终于开源，能够生成1024*1024的图片，速度超级快。你可以在在线演示中亲自感受其超快的生成速度。

来源：三花快讯

12月 30日

6 条新闻

00:00

PixVerse V3.5 正式上线，模型全面升级，10秒极速生成

爱诗科技宣布PixVerse V3.5版本正式上线，新版本在Turbo模式下10秒内即可生成高质量视频，保持行业领先的语义理解和细节表现力。动漫生成效果显著提升，支持通过文生视频描述特定风格或上传图片生成动漫效果。新增首尾帧功能，激发创作灵感。
来源：爱诗科技 AIsphere

来源：AI工具集

00:00

支付宝「探一下」新一代AI视觉搜索产品，满足你的好奇心

支付宝推出新功能“探一下”，基于自研的多模态大模型技术，能够“用AI之眼探索万物”，提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务：探知识、探灵感、探文本。可以根据自己的需求选择相应的服务，满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源：支付宝

来源：AI工具集

00:00

爱诗科技PixVerse V3.5上线：5秒生成高清视频，动漫效果大幅提升

爱诗科技PixVerse V3.5上线：5秒生成高清视频，动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线，带来显著性能提升和新功能。新版本可在5秒内生成视频，增强运动控制力，支持多种动漫风格切换，满足个性化需求。视频质量提升至1080p高清，并实现首尾帧丝滑过渡，提升整体观感。此前，爱诗科技完成近3亿元A+轮融资，资金将用于技术研发、扩展算力及人才团队建设。

来源：AI Base

00:00

英伟达的下一步：为类人机器人提供动力

Nvidia 宣布将于 2025 年上半年推出新一代紧凑型计算机 Jetson Thor，专为人形机器人设计。这一举措标志着 Nvidia 在机器人领域的深入布局，旨在为全球数十万机器人制造商提供底层技术支持。Nvidia 副总裁 Deepu Talla 指出，这一战略得益于生成式 AI 模型的爆发式增长，以及利用模拟环境训练机器人的能力。此举也反映了 Nvidia 在 AI 芯片市场竞争加剧的背景下，通过机器人技术拓展业务版图的战略意图。

来源：TechCrunch AI

00:00

商汤科技推出 Large Motion Model：统一多模态运动生成大模型

商汤科技推出 Large Motion Model：统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心，构建了一个多模态框架，将主流运动生成任务整合为一个通用模型。

用户只需输入描述，即可生成一段运动姿势视频。目前，该模型已完全开源，支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源：三花快讯

00:00

人工智能数据中心可能正在“扭曲”美国电力网

随着AI数据中心激增，美国电网面临严峻挑战。Bloomberg报告指出，超过一半电力失真严重的家庭位于数据中心20英里范围内，导致“不良谐波”问题，可能损坏家电、增加火灾风险，甚至引发停电。AI数据中心因能源需求波动性大，对电网压力尤为突出。Bloom Energy首席商务官Aman Joshi强调，现有电网设计无法同时应对多个数据中心的负载波动。这一现象凸显了AI技术快速发展背后的基础设施瓶颈，亟需在算力效率与能源管理之间寻求平衡。

来源：TechCrunch AI