已选标签:
1月 13日
2 条新闻
09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

04:23

2025年CES:自动驾驶汽车无处不在,以及其他交通科技趋势

CES 2025 聚焦自动驾驶技术,AI 驱动未来交通。NVIDIA 与丰田深化合作,推动 Drive AGX Orin SoC 和 DriveOS 在下一代车辆中的应用。多家公司展示自动驾驶解决方案,涵盖机器人出租车、农业机械及越野环境。Honda 推出 Asimo 操作系统,支持高级驾驶辅助系统(ADAS)。Comma.ai 开源驾驶辅助系统与 Tesla Autopilot 媲美。AI 在交通领域的应用加速,技术覆盖仿真、机器学习、传感器集成等,预示自动驾驶技术将迎来更广泛应用。

来源:TechCrunch AI

1月 12日
1 条新闻
01:53

驾驶Arc Sport电动船时我被淋湿了

Arc 公司展示了其新型电动运动船 Arc Sport,该船采用先进的智能软件系统,包括特斯拉风格的水平触摸屏和实时更新的车载软件。通过 AI 驱动的双推进器系统,Arc Sport 实现了精准操控和高效能源管理,展示了 AI 在电动交通工具中的创新应用。Arc 的快速产品迭代和规模化生产能力得益于其早期小规模生产的经验积累,体现了 AI 技术在制造业中的加速作用。

来源:TechCrunch AI

1月 11日
2 条新闻
23:00

英伟达的AI帝国:聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。

来源:TechCrunch AI

01:24

50亿美元直播购物应用、英伟达的发布以及 CES 上最奇特的技术

CES 2025 展示了 AI 技术的多样化应用与创新趋势,包括智能家居设备(如机器人吸尘器)和智能眼镜等消费级产品。Nvidia 的 Project Digits 项目预示了 AI 在边缘计算和实时交互领域的潜力,可能推动未来初创企业的技术突破。尽管部分企业仍处于实验阶段,但 AI 在提升用户体验和优化硬件性能方面的进展显著。此外,Meta 的‘更多言论,更少错误’策略反映了 AI 在内容审核和自然语言处理中的持续优化需求。

来源:TechCrunch AI

1月 10日
7 条新闻
21:00

Gumloop成立于温哥华的一间卧室,让用户通过拖放模块自动执行任务

Gumloop 利用 AI 技术实现企业工作流自动化,专注于简化重复性任务。其基于 Auto-GPT 的模块化工作流构建器,支持与 GitHub、Gmail 等第三方工具集成,为非技术人员提供低门槛的自动化解决方案。尽管当前 AI 在复杂任务中的可靠性有限,Gumloop 通过聚焦特定场景,展现了 AI 在提升效率和降低成本方面的潜力。公司计划保持小团队规模,利用 AI 辅助开发实现高效产出,并已获得 2000 万美元融资,加速产品扩展。

来源:TechCrunch AI

10:11

特斯拉在中国推出新款Model Y

特斯拉发布新款 Model Y,针对亚太市场进行设计更新,重点优化了自动驾驶相关硬件和软件集成。新车采用与 Cybertruck 相似的连续灯条设计,提升了视觉识别系统的兼容性。内饰新增后排触控屏,可能整合了多模态交互功能。此次更新反映了特斯拉在自动驾驶技术上的持续投入,同时通过轻量化设计和悬挂优化,提升了 AI 系统的感知精度和决策效率。特斯拉正加速 AI 技术在汽车领域的商业化落地,以应对日益激烈的市场竞争。

来源:TechCrunch AI

09:54

百度与复旦大学联合开源 Hello3:革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处理正面肖像,还能应对各种角度和姿态,甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比,Hallo3 在生成动态场景和沉浸式背景方面有了显著提升,让肖像动画不再局限于简单的表情变化,而是能将角色也融入到场景中。

来源:三花快讯

08:52

希波克拉底人工智能筹集1.41亿美元用于创建面向患者的AI代理

Hippocratic AI 完成 1.41 亿美元 B 轮融资,估值达 16.4 亿美元,专注于开发面向患者的非诊断性 AI 解决方案。该公司通过生成式 AI 技术,创建能够执行术前准备、远程患者监控等任务的智能代理,缓解医疗专业人员短缺问题。其技术核心在于利用大语言模型和强化学习优化医疗流程,目前已与 23 家医疗系统和保险公司达成合作。未来,Hippocratic AI 计划扩展国际市场,推动 AI 在医疗领域的规模化应用。

来源:TechCrunch AI

06:37

TikTok告知受野火影响的洛杉矶员工,如无法在家工作请使用个人或病假时间

AI 技术在自然灾害管理中的应用潜力凸显。洛杉矶山火事件中,TikTok 员工因停电和疏散令被迫居家办公,暴露了远程协作工具的局限性。未来,AI 驱动的智能应急管理系统可通过联邦学习整合多源数据,实时预测灾害影响,优化资源分配,并支持远程办公基础设施的弹性扩展。此外,AI 辅助的心理健康服务(如 Lyra)在危机中的重要性也得到验证,为 AI 在灾害应对和员工福祉领域的深度应用提供了新思路。

来源:TechCrunch AI

00:16

PowerSchool称黑客窃取了学生的敏感数据,包括社会安全号码,造成数据泄露

教育科技巨头 PowerSchool 遭遇数据泄露,黑客窃取了包括学生社保号、成绩和医疗信息在内的高度敏感数据。此次事件凸显了 AI 在教育领域应用中数据安全的严峻挑战。随着 AI 技术在教育管理系统的广泛应用,如何通过联邦学习等技术保护敏感数据,同时提升系统安全性,成为行业亟待解决的问题。未来,AI 在数据加密、异常检测等安全领域的创新将至关重要。

来源:TechCrunch AI

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能,通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术,将用户兴趣转化为 5 分钟音频摘要,并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似,均通过 AI 虚拟主持人生成内容,展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放,标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源:TechCrunch AI

1月 9日
6 条新闻
15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok,扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能,尤其在图像生成领域表现出色,支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问,进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源:TechCrunch AI

09:14

Adobe 发布 TransPixar:生成透明背景视频的创新技术

TransPixar 是 Adobe 最新发布的一项创新技术,能够通过文本和图像生成透明背景的视频。

不仅支持创建烟雾和反射等透明元素,还提供了高度逼真的视觉效果。可以看看演示视频,效果相当不错。也可以在 Hugging Face 体验在线版本,不过在线版限制了帧率和推理步骤。代码是开源的,有兴趣的可以直接本地部署。

来源:三花快讯

09:14

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG 是一款创新的工具,能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出,NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色,生成的 SVG 文件不仅结构清晰,还支持分层编辑,极大地方便了设计师和开发者。目前,NeuralSVG 尚未开源,但我会持续跟进最新动态,第一时间为大家带来更新。关注我,不错过任何重要信息!

来源:三花快讯

07:36

2025年CES:本届展会最奇特的科技产品和声明

CES 2025 展示了多项 AI 驱动的创新产品,涵盖日常生活与娱乐场景。AI 技术在多模态感知和智能控制方面取得突破,如 Spicerr 的 AI 调味料分配器,通过深度学习优化配方推荐;智能鸟浴盆 Bath Pro 利用计算机视觉识别鸟类并拍照。此外,AI 在硬件设计中的应用也引人注目,如联想推出的可卷曲屏幕笔记本 ThinkBook Plus Gen 6 Rollable,结合 AI 手势控制实现屏幕扩展。这些产品体现了 AI 在边缘计算、个性化服务和智能交互领域的快速发展趋势。

来源:TechCrunch AI

04:08

游戏玩家无法理解6x CEO埃隆·马斯克是如何抽出时间击败《暗黑破坏神IV》的

埃隆·马斯克在短时间内完成《暗黑破坏神 IV》最高难度挑战引发热议,推测其可能利用 AI 辅助工具或优化算法提升游戏效率。这一事件凸显了 AI 在游戏领域的潜在应用,如通过强化学习优化玩家策略、利用计算机视觉辅助操作等。未来,AI 与游戏结合将进一步推动多模态模型和实时决策技术的发展,为游戏体验和竞技水平带来革新。

来源:TechCrunch AI

1月 6日
2 条新闻
10:35

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT

来源:GitHub