AI新闻 | goodux 好体验

标签筛选

已选标签:

1月 20日

2 条新闻

15:49

非洲风投公司Oui Capital如何通过Moniepoint的独角兽退出实现其首个基金回报

非洲金融科技独角兽 Moniepoint 的成功退出凸显了早期投资在金融科技领域的潜力。Oui Capital 通过其首支基金投资 Moniepoint，实现了 8 倍回报，并成功返还了 400 万美元的基金。这一案例展示了 AI 技术在金融科技中的应用价值，特别是在支付流程数字化和 B2B 平台优化方面。Moniepoint 的成长历程也反映了 AI 驱动型企业在非洲市场的快速发展，尽管该地区的退出机会仍相对稀缺。未来，随着 AI 技术的进一步成熟，金融科技领域的投资回报潜力有望继续扩大。

来源：TechCrunch AI

13:49

通义：一分钟生成互动2D卡通角色，Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐，尤其受年轻观众欢迎。尽管3D技术发展迅速，但Live2D格式的2D卡通角色因其高效、轻量的特点，提供了模拟3D运动的动画效果，无需构建完整的3D模型。最新推出的Textoon方法，基于文本描述生成多样化的2D卡通角色，利用先进的语言和视觉模型，快速生成生动互动的角色，显著提升了创作效率与多样性。

来源：github

1月 19日

1 条新闻

23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明，尽管大语言模型（LLMs）在编程等任务中表现出色，但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型，发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时，倾向于从显性数据中推断，难以检索到更隐晦的历史知识。此外，模型在特定地区（如撒哈拉以南非洲）的表现较差，暗示训练数据可能存在偏差。研究指出，LLMs 在历史研究领域仍需改进，但未来有望辅助历史学家，特别是在扩展数据覆盖和增加问题复杂性方面。

来源：TechCrunch AI

1月 17日

1 条新闻

06:32

尽管风投在第四季度投资了750亿美元，初创企业融资依然困难，数据证明这一点。

2023年第四季度，美国初创企业融资达746亿美元，其中432%集中于少数AI巨头：Databricks（100亿）、OpenAI（66亿）、xAI（60亿）、Waymo（56亿）和Anthropic（40亿）。这些巨额融资凸显了AI领域的两极分化趋势，资金高度集中于大语言模型、生成式AI和自动驾驶等前沿技术。尽管整体融资回暖，但大部分初创企业仍面临融资困境，表明AI产业生态正加速向头部企业集中。未来，VC投资可能继续聚焦于最具潜力的AI公司，推动基础模型、多模态融合和自动驾驶等技术的商业化落地。

来源：TechCrunch AI

1月 15日

5 条新闻

22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司，旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库，专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长，Rockfish 通过技术差异化（如持续数据摄入）和高质量团队（多位数据科学博士）脱颖而出。该公司已获 600 万美元融资，客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长，合成数据领域竞争加剧，Tonic AI、Mostly AI 等公司也在积极布局。

来源：TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI，该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI，推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术，快速生成“SimReady”数字孪生，将 CAD 文件转化为功能化 3D 环境，加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域，通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局，创建适用于机器人等高级自动化系统的数字孪生，弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展，为工业 AI 应用提供更高效的解决方案。

来源：TechCrunch AI

05:47

任天堂Switch 2或于本周公布：截至目前的传闻与事实

任天堂Switch 2或于本周公布：截至目前的传闻与事实

Nintendo Switch 2 即将发布，预计将延续前代产品的成功，并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布，但业界猜测新主机可能在图形处理、多模态交互（如磁吸 Joy-Con）和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外，向后兼容性确保了现有用户的平滑过渡，进一步巩固 Nintendo 在游戏市场的地位。

来源：TechCrunch AI

05:45

英特尔将其企业风险投资部门英特尔资本分拆为独立基金

Intel 宣布计划将其企业风投部门 Intel Capital 分拆为独立基金，以增强其投资灵活性和吸引外部资本的能力。Intel Capital 自 2014 年起加大了对 AI 初创企业的投资，包括 AI 芯片公司 SambaNova、AI21 Labs、人形机器人公司 Figure 和 AI 开发平台 Anyscale。此举旨在优化资产价值并提升业务效率，同时支持 AI 芯片、边缘计算和云计算等领域的创新。分拆预计于 2025 年下半年完成，标志着 Intel 在 AI 产业生态中的进一步布局。

来源：TechCrunch AI

02:05

为什么一些前Bench客户不满意

金融科技领域 AI 应用持续扩展：Moody’s 收购地理空间 AI 初创公司 Cape Analytics，强化其在风险评估中的 AI 能力；Open Ledger 推出嵌入式自动化会计软件，推动企业财务流程智能化。此外，Plaid 计划在 Raleigh 开设新办公室，以满足金融服务业对 AI 技术日益增长的需求。这些动态凸显了 AI 在金融科技中的关键作用，尤其是在自动化、数据分析和风险管理等领域的深度应用。

来源：TechCrunch AI

1月 13日

2 条新闻

09:47

Adobe FaceLift：单张照片生成高保真 3D 头部模型

Adobe FaceLift：单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术，仅需一张人脸照片，就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图，然后通过 GS-LRM 重建器生成 3D 高斯样条表示，实现全头新视角的合成。

此外，FaceLift 还能处理视频输入，进行 4D 合成，并与 2D 动画技术结合，实现 3D 面部动画。

从官网的一些交互式案例来看，效果还不错，不过不能放大看，恐怖谷效应拉满了。目前这项技术还没有开源，关注我为你持续跟进。

来源：三花快讯

09:47

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI，支持 Qwen 全系列模型。

模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型，以及 Qwen2.5-Coder-32B-Instruct 编程模型。

Qwen Chat 支持同时对比多个模型，还即将推出网络搜索、图像生成和语音模式，值得期待。

来源：三花快讯

1月 11日

1 条新闻

23:00

英伟达的AI帝国：聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起，成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来，其营收和股价大幅增长，并显著加大了对 AI 初创企业的投资。2024 年，Nvidia 参与了 49 轮 AI 公司融资，远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业，以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统，推动大模型、自动驾驶、AI 基础设施等技术的商业化落地，展现了其在 AI 产业链中的核心地位。

来源：TechCrunch AI

1月 10日

2 条新闻

09:54

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头（肖像动画）技术，能让静态肖像在各种场景下动起来，而且动作自然、画面逼真。它不仅能处理正面肖像，还能应对各种角度和姿态，甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比，Hallo3 在生成动态场景和沉浸式背景方面有了显著提升，让肖像动画不再局限于简单的表情变化，而是能将角色也融入到场景中。

来源：三花快讯

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能，通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术，将用户兴趣转化为 5 分钟音频摘要，并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似，均通过 AI 虚拟主持人生成内容，展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放，标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源：TechCrunch AI

1月 9日

4 条新闻

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok，扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能，尤其在图像生成领域表现出色，支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问，进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源：TechCrunch AI

09:14

SAI 开源 SPAR3D：一秒内从单图生成可编辑 3D 模型

SPAR3D 是 SAI 最近开源的一项图生 3D 技术，能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非商业用途均免费开放，只要年收入小于 100 万美元即可使用。目前，代码和模型都已经公开发布。

来源：三花快讯

09:14

NeuralSVG：文本生成可编辑矢量图形的创新工具

NeuralSVG：文本生成可编辑矢量图形的创新工具

NeuralSVG 是一款创新的工具，能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出，NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色，生成的 SVG 文件不仅结构清晰，还支持分层编辑，极大地方便了设计师和开发者。目前，NeuralSVG 尚未开源，但我会持续跟进最新动态，第一时间为大家带来更新。关注我，不错过任何重要信息！

来源：三花快讯

09:14

Adobe 发布 TransPixar：生成透明背景视频的创新技术

TransPixar 是 Adobe 最新发布的一项创新技术，能够通过文本和图像生成透明背景的视频。

不仅支持创建烟雾和反射等透明元素，还提供了高度逼真的视觉效果。可以看看演示视频，效果相当不错。也可以在 Hugging Face 体验在线版本，不过在线版限制了帧率和推理步骤。代码是开源的，有兴趣的可以直接本地部署。

来源：三花快讯

1月 6日

2 条新闻

10:35

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

SHMT自监督层级化妆迁移模型代码开源，NeurIPS2024官方认证！

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型，采用隐式扩散模型实现自监督层级化妆迁移，已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型，已开源并验证可正常训练和推理。此外，团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接：https://github.com/Snowfallingplum/SHMT

来源：GitHub

00:00

TangoFlux：极速文本转音频生成模型

TangoFlux 是一个开源的极速文本转音频（TTA）生成模型，在单个 A40 GPU 上仅需 3.7 秒即可生成 30 秒的 44.1kHz 音频。佬友们可以在线体验看看，速度确实飞快，生成的质量也算还行。

来源：三花快讯