AI新闻 | goodux 好体验

标签筛选

已选标签:

1月 20日

6 条新闻

16:33

X 正在美国为用户推出专属的垂直视频信息流

社交平台 X 推出垂直视频专区，利用 AI 驱动的推荐算法优化用户体验。此举旨在填补 TikTok 等应用在美国市场的空缺，通过深度学习技术提升视频内容的分发效率和用户粘性。X 此前已推出独立电视应用，显示其在视频领域的持续布局。随着 Meta 等竞争对手推出类似功能，AI 驱动的视频推荐和编辑工具正成为社交平台竞争的关键技术。未来，多模态模型和个性化推荐算法的进一步融合将推动视频内容生态的智能化发展。

来源：TechCrunch AI

13:49

通义：一分钟生成互动2D卡通角色，Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐，尤其受年轻观众欢迎。尽管3D技术发展迅速，但Live2D格式的2D卡通角色因其高效、轻量的特点，提供了模拟3D运动的动画效果，无需构建完整的3D模型。最新推出的Textoon方法，基于文本描述生成多样化的2D卡通角色，利用先进的语言和视觉模型，快速生成生动互动的角色，显著提升了创作效率与多样性。

来源：github

13:02

Bluesky推出垂直视频定制信息流

Bluesky 推出垂直视频定制 feed，利用其去中心化协议 AT Protocol 支持开发者构建 TikTok 替代应用，如 Tik.Blue 和 Skylight.Social。此举展示了 AI 驱动的个性化推荐技术在社交媒体中的应用，同时反映了去中心化社交平台的崛起。随着 TikTok 相关争议，Bluesky 用户增长至 2800 万，凸显了 AI 在内容分发和用户体验优化中的关键作用。Meta 和 X 也推出类似功能，表明 AI 驱动的视频内容竞争加剧。

来源：TechCrunch AI

11:23

MangaNinja：开源线稿上色工具

MangaNinja 是一款创新的开源线稿上色工具，它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。该工具支持多角色草图参考多张图片和单角色草图参考多张图片。佬们可以看下视频演示，感受下网球王子版的智爷。此外，这里还有个在线 Demo。

来源：三花快讯

11:23

黑森林实验室推出 FLUX Pro Finetuning API：轻松定制你的图像模型

黑森林实验室（Black Forest Labs）最新发布的 FLUX Pro Finetuning API，让任何人都能轻松使用自己的图片来定制 FLUX Pro 模型。这个 API 的亮点在于它的易用性和灵活性，最简单的例子就是你可以把你的 logo 融入生成的图像中，实现营销和推广。想了解更多详情，可以查看官方博客。

来源：三花快讯

01:53

TikTok 恢复在美国的服务

TikTok 在美国的服务中断事件凸显了 AI 技术在跨境数据安全和政策合规中的关键作用。作为依赖 AI 推荐算法的短视频平台，TikTok 的恢复运营依赖于政策明确性和技术基础设施的稳定性。事件反映了 AI 应用在全球化部署中面临的法律风险和算力保障挑战，同时也揭示了 AI 技术在中小企业赋能和用户行为分析中的商业价值。未来，AI 平台的可持续运营将更加依赖于技术创新与政策环境的协同发展。

来源：TechCrunch AI

1月 19日

2 条新闻

23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明，尽管大语言模型（LLMs）在编程等任务中表现出色，但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型，发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时，倾向于从显性数据中推断，难以检索到更隐晦的历史知识。此外，模型在特定地区（如撒哈拉以南非洲）的表现较差，暗示训练数据可能存在偏差。研究指出，LLMs 在历史研究领域仍需改进，但未来有望辅助历史学家，特别是在扩展数据覆盖和增加问题复杂性方面。

来源：TechCrunch AI

05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案，旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展，同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战，Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径，推动多模态 AI 技术的进一步发展。

来源：TechCrunch AI

1月 15日

4 条新闻

22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司，旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库，专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长，Rockfish 通过技术差异化（如持续数据摄入）和高质量团队（多位数据科学博士）脱颖而出。该公司已获 600 万美元融资，客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长，合成数据领域竞争加剧，Tonic AI、Mostly AI 等公司也在积极布局。

来源：TechCrunch AI

15:00

Synthesia以21亿美元估值为其B2B人工智能视频平台筹集1.8亿美元

Synthesia 凭借其高度逼真的 AI 虚拟人技术，在企业级视频生成领域取得显著进展，已服务 60,000 家企业，用户达 100 万。最新完成 1.8 亿美元 D 轮融资，估值达 21 亿美元。公司计划扩展亚太市场，并持续优化虚拟人技术，包括提升动作真实性、环境适应性和交互能力。Synthesia 依赖第三方大语言模型和语音技术，专注于产品自研，避免并购。AI 视频功能日益普及，Synthesia 致力于成为企业视频交互的首选平台，同时面临 AI 能耗、版权和伦理等挑战。

来源：TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI，该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI，推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术，快速生成“SimReady”数字孪生，将 CAD 文件转化为功能化 3D 环境，加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域，通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局，创建适用于机器人等高级自动化系统的数字孪生，弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展，为工业 AI 应用提供更高效的解决方案。

来源：TechCrunch AI

05:47

任天堂Switch 2或于本周公布：截至目前的传闻与事实

任天堂Switch 2或于本周公布：截至目前的传闻与事实

Nintendo Switch 2 即将发布，预计将延续前代产品的成功，并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布，但业界猜测新主机可能在图形处理、多模态交互（如磁吸 Joy-Con）和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外，向后兼容性确保了现有用户的平滑过渡，进一步巩固 Nintendo 在游戏市场的地位。

来源：TechCrunch AI

1月 13日

4 条新闻

09:47

xAI 发布 Grok iOS 应用，支持图像生成与实时数据访问

xAI 发布 Grok iOS 应用，支持图像生成与实时数据访问

Grok iOS App 现已上线美区 App Store，支持生成图像和对话。用户需要使用 X 账号登录，以实时访问 X 和 Web 数据。

系统版本要求较高，需更新至 iOS 17 才能安装，如果你在用巨魔啥的就无缘了。安卓版本即将推出。

来源：三花快讯

09:47

快手 Kling APP 登陆美区 App Store，安卓版即将推出

快手 Kling APP 登陆美区 App Store，安卓版即将推出

Kling APP 现已正式上架美区 App Store，安卓版本也即将上线。

简单体验了一下，和 Web 版本差不多，支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。

来源：三花快讯

09:47

Adobe FaceLift：单张照片生成高保真 3D 头部模型

Adobe FaceLift：单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术，仅需一张人脸照片，就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图，然后通过 GS-LRM 重建器生成 3D 高斯样条表示，实现全头新视角的合成。

此外，FaceLift 还能处理视频输入，进行 4D 合成，并与 2D 动画技术结合，实现 3D 面部动画。

从官网的一些交互式案例来看，效果还不错，不过不能放大看，恐怖谷效应拉满了。目前这项技术还没有开源，关注我为你持续跟进。

来源：三花快讯

09:47

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI，支持 Qwen 全系列模型。

模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型，以及 Qwen2.5-Coder-32B-Instruct 编程模型。

Qwen Chat 支持同时对比多个模型，还即将推出网络搜索、图像生成和语音模式，值得期待。

来源：三花快讯

1月 11日

1 条新闻

23:00

英伟达的AI帝国：聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起，成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来，其营收和股价大幅增长，并显著加大了对 AI 初创企业的投资。2024 年，Nvidia 参与了 49 轮 AI 公司融资，远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业，以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统，推动大模型、自动驾驶、AI 基础设施等技术的商业化落地，展现了其在 AI 产业链中的核心地位。

来源：TechCrunch AI

1月 10日

2 条新闻

09:54

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头（肖像动画）技术，能让静态肖像在各种场景下动起来，而且动作自然、画面逼真。它不仅能处理正面肖像，还能应对各种角度和姿态，甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比，Hallo3 在生成动态场景和沉浸式背景方面有了显著提升，让肖像动画不再局限于简单的表情变化，而是能将角色也融入到场景中。

来源：三花快讯

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能，通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术，将用户兴趣转化为 5 分钟音频摘要，并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似，均通过 AI 虚拟主持人生成内容，展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放，标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源：TechCrunch AI

1月 9日

1 条新闻

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok，扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能，尤其在图像生成领域表现出色，支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问，进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源：TechCrunch AI