已选标签:
1月 10日
4 条新闻
10:11

特斯拉在中国推出新款Model Y

特斯拉发布新款 Model Y,针对亚太市场进行设计更新,重点优化了自动驾驶相关硬件和软件集成。新车采用与 Cybertruck 相似的连续灯条设计,提升了视觉识别系统的兼容性。内饰新增后排触控屏,可能整合了多模态交互功能。此次更新反映了特斯拉在自动驾驶技术上的持续投入,同时通过轻量化设计和悬挂优化,提升了 AI 系统的感知精度和决策效率。特斯拉正加速 AI 技术在汽车领域的商业化落地,以应对日益激烈的市场竞争。

来源:TechCrunch AI

08:31

英伟达的AI头像出现在我的电脑屏幕上,让我感到十分诡异

英伟达的AI头像出现在我的电脑屏幕上,让我感到十分诡异

Nvidia 在 CES 2025 上推出桌面 AI 助手 R2X,结合生成式游戏技术与大语言模型(如 GPT-4o 和 Grok),提供多模态交互能力。R2X 支持文本、语音输入,可处理文件、实时屏幕分析,并集成检索增强生成(RAG)技术。尽管原型存在视觉和功能缺陷(如屏幕识别错误),Nvidia 计划 2025 年上半年开源该技术,推动开发者生态。R2X 展示了 AI 助手在桌面应用中的潜力,但也凸显了多模态模型在实时交互和准确性上的技术挑战。

来源:TechCrunch AI

06:37

TikTok告知受野火影响的洛杉矶员工,如无法在家工作请使用个人或病假时间

AI 技术在自然灾害管理中的应用潜力凸显。洛杉矶山火事件中,TikTok 员工因停电和疏散令被迫居家办公,暴露了远程协作工具的局限性。未来,AI 驱动的智能应急管理系统可通过联邦学习整合多源数据,实时预测灾害影响,优化资源分配,并支持远程办公基础设施的弹性扩展。此外,AI 辅助的心理健康服务(如 Lyra)在危机中的重要性也得到验证,为 AI 在灾害应对和员工福祉领域的深度应用提供了新思路。

来源:TechCrunch AI

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能,通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术,将用户兴趣转化为 5 分钟音频摘要,并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似,均通过 AI 虚拟主持人生成内容,展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放,标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源:TechCrunch AI

1月 9日
9 条新闻
15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok,扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能,尤其在图像生成领域表现出色,支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问,进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源:TechCrunch AI

09:14

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG 是一款创新的工具,能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出,NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色,生成的 SVG 文件不仅结构清晰,还支持分层编辑,极大地方便了设计师和开发者。目前,NeuralSVG 尚未开源,但我会持续跟进最新动态,第一时间为大家带来更新。关注我,不错过任何重要信息!

来源:三花快讯

07:36

2025年CES:本届展会最奇特的科技产品和声明

CES 2025 展示了多项 AI 驱动的创新产品,涵盖日常生活与娱乐场景。AI 技术在多模态感知和智能控制方面取得突破,如 Spicerr 的 AI 调味料分配器,通过深度学习优化配方推荐;智能鸟浴盆 Bath Pro 利用计算机视觉识别鸟类并拍照。此外,AI 在硬件设计中的应用也引人注目,如联想推出的可卷曲屏幕笔记本 ThinkBook Plus Gen 6 Rollable,结合 AI 手势控制实现屏幕扩展。这些产品体现了 AI 在边缘计算、个性化服务和智能交互领域的快速发展趋势。

来源:TechCrunch AI

06:10

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

Halliday 在 CES 2025 推出的智能眼镜通过 DigiWindow 技术,将 3.5 英寸圆形显示屏直接投射到用户视野中,支持实时语言翻译、手机通知显示及 AI 助手功能。该设备采用轻量化设计,无需昂贵 AR 镜片,支持处方镜片,定价 489 美元。其核心技术结合了多模态 AI 模型,支持 40 种语言的实时翻译,并计划集成主动式 AI 助手。尽管 DigiWindow 的定位仍需优化,但其轻便、低延迟的特点展示了智能眼镜在 AI 助手、多模态交互等领域的潜力,为未来可穿戴设备的 AI 应用提供了新方向。

来源:TechCrunch AI

04:08

游戏玩家无法理解6x CEO埃隆·马斯克是如何抽出时间击败《暗黑破坏神IV》的

埃隆·马斯克在短时间内完成《暗黑破坏神 IV》最高难度挑战引发热议,推测其可能利用 AI 辅助工具或优化算法提升游戏效率。这一事件凸显了 AI 在游戏领域的潜在应用,如通过强化学习优化玩家策略、利用计算机视觉辅助操作等。未来,AI 与游戏结合将进一步推动多模态模型和实时决策技术的发展,为游戏体验和竞技水平带来革新。

来源:TechCrunch AI

02:24

乌克兰黑客声称对攻击俄罗斯互联网服务提供商负责,该攻击摧毁了服务器并导致互联网中断

俄罗斯互联网服务提供商 Nodex 遭受乌克兰黑客组织攻击,导致其网络系统被完全破坏,服务器数据被擦除,客户互联网连接中断。此次事件凸显了网络安全在 AI 基础设施中的重要性,尤其是在分布式系统、数据备份和恢复等关键领域。AI 技术如联邦学习和强化学习可用于增强网络防御能力,而多模态模型和预训练模型在威胁检测和响应中具有潜力。未来,AI 驱动的网络安全解决方案将成为保护关键基础设施的重要趋势。

来源:TechCrunch AI

01:05

实时更新 CES 2025:英伟达、人工智能、电动汽车发布及更多第二天动态

CES 2025 展示了 AI 技术的多样化应用与创新趋势。Nvidia CEO 强调其系统性能超越摩尔定律,通过全栈创新推动 AI 算力提升。Delta Air Lines 推出 AI 助手,优化用户体验并整合 Uber 服务。AI 在宠物科技领域也取得进展,如 Birdfy 的 AI 鸟类识别系统。此外,Waymo-Zeekr 合作的自动驾驶出租车亮相,突显 AI 在交通领域的突破。整体来看,AI 正加速渗透至消费、交通、娱乐等多个场景,推动产业智能化升级。

来源:TechCrunch AI

1月 8日
3 条新闻
23:31

微软在用户投诉图像质量下降后回退其必应图像生成模型

微软在 Bing Image Creator 中升级了基于 OpenAI DALL-E 3 的 AI 图像生成模型(PR16),承诺提升生成速度与质量,但用户反馈图像质量显著下降,导致微软决定回滚至旧版本(PR13)。此次事件凸显了 AI 模型在真实场景中的评估挑战,内部基准测试与用户感知存在偏差。同时,这也反映了多模态生成模型在细节与真实性优化上的技术瓶颈,以及企业在模型迭代中平衡性能与用户体验的复杂性。

来源:TechCrunch AI

16:17

微软通过公共和私营部门的交易支持其在印度的30亿美元人工智能计划

微软宣布在印度核心领域展开广泛AI合作,计划投资30亿美元,与政府及企业合作推动AI技术应用。重点包括:支持印度AI数据集平台的数据收集与合成生成,培训50万名AI技术人才,建立AI卓越中心及20个AI实验室。合作涵盖铁路、医疗、金融、制造和教育领域,如与RailTel合作推进铁路数字化和AI转型,与Apollo Hospitals开发医疗AI助手,与Bajaj Finance合作实现年成本节约1800万美元。此举旨在与谷歌、亚马逊等竞争,加速AI在印度的商业落地和人才培养,推动多模态AI和边缘计算等技术的应用。

来源:TechCrunch AI

09:43

英伟达开源 Cosmos 世界模型:助力机器人与自动驾驶数据生成

英伟达开源了 Cosmos 世界模型,这模型支持文生视频和文+视频生视频,主要应用于机器人和自动驾驶领域的大规模合成数据生成。

目前,英伟达已经开放了多个不同的预训练模型,这些模型均支持商业用途。佬友们也可以在线体验下,看看这个模型的实际效果如何。

来源:三花快讯

1月 6日
4 条新闻
11:26

「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用

昆仑万维集团宣布,「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP,供用户免费使用。o1版专注于中文逻辑推理,具备强大的数学、代码、逻辑、常识和伦理决策能力,通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型,语音对话助手Skyo具有情感表达和多语言切换能力,提供流畅的实时对话体验。
来源:昆仑万维集团

来源:AI工具集

08:56

萨姆·阿尔特曼对解雇他的OpenAI董事会成员有话要说

OpenAI CEO Sam Altman 在采访中透露了公司未来技术发展方向,包括芯片计划和大语言模型 ChatGPT 的定价策略。这一事件凸显了 AI 企业在技术研发与商业化落地中的关键挑战,如算力优化、成本控制和商业模式的探索。OpenAI 的技术路线将继续影响大语言模型和多模态 AI 的发展,推动其在智能助手、AI 编程等领域的应用深化。

来源:TechCrunch AI

04:48

对Adrian Dittman/Elon Musk阴谋论者的坏消息

新闻揭示了 AI 在身份验证和社交媒体分析中的应用潜力。通过语音识别和图像分析技术,结合社交媒体行为数据,AI 能够辅助验证用户身份的真实性。这一案例展示了 AI 在跨模态数据分析(如语音、图像和行为模式)中的实际应用,突显了其在网络安全和数字身份管理领域的重要性。未来,随着多模态 AI 技术的进一步发展,类似应用将更加精准和高效。

来源:TechCrunch AI