solidot新版网站常见问题,请点击这里查看。
人工智能
Edwards(42866)
发表于2025年09月12日 22时57分 星期五
来自惊涛怪浪
Perplexity AI 成为最新一家被版权所有者起诉的 AI 公司。Perplexity 的“答案引擎(answer engine)”通过搜索互联网并总结其发现的内容,为传统搜索引擎提供了一种基于 AI 的替代。大英百科全书(Encyclopedia Britannica)和韦氏词典(Merriam-Webster)指控 Perplexity 未经许可抓取了其网站内容,复制并转载其内容,侵犯了版权。Perplexity 生成的 AI 答案不可避免的会带有幻觉——即捏造的错误信息。大英百科和韦氏词典指控 Perplexity 将 AI 的幻觉归因于它们,侵犯了其商标权。它们要求赔偿并禁止 Perplexity 滥用其内容。

人工智能
Edwards(42866)
发表于2025年09月11日 17时33分 星期四
来自树上银花
古墓丽影系列的法语配音演员 Françoise Cadol 向《古墓丽影 4-6 重制版(Tomb Raider 4-6 Remastered)》开发商 Aspyr 发出停止通知函(cease and desist),指控 Aspyr 使用 AI 拷贝其声音但没有通知她或告诉游戏玩家。她形容此举是一种背叛,一种彻底的不尊重。除了法语,巴西和西班牙等地区的玩家也认为其语种的配音是由 AI 生成的,AI 合成了原配音演员的声音。巴西配音演员 Lene Bastos 收到了 Aspyr 的一封回信,它的调查显示外部开发合作伙伴在其不知情下使用生成式 AI 编辑原始声音,它表示自己没有授权这么做,对未能在审核中注意到该问题表示歉意。

人工智能
Edwards(42866)
发表于2025年09月08日 13时21分 星期一
来自歌剧院魅影
清华、蚂蚁和新加坡南洋理工的研究人员在预印本平台 arxiv 上发表了一篇论文《Speculating LLMs’ Chinese Training Data Pollution from Their Tokens》,指出 OpenAI 的 GPT 系列模型使用的中文语料被成人和网络赌博内容污染。大模型使用从互联网上爬取的内容进行预训练,而爬取的内容不可避免会混入成人色情或网络赌博等污染内容。如果不仔细清理数据,那么在构建词汇表和执行分词(Performing tokenization)时可能会生成污染词元(polluted tokens),GPT 系列模型使用的中文词汇表就存在大量污染的中文词元。GPT-o1/o3/4.5/4.1/o4-mini 等模型都使用污染的中文语料库进行了训练。研究人员发现,在 GPT 模型语料库中,超过 23% 的长中文词元或者是成人内容或者是网络赌博,以 GPT-4o 为例,与日本 AV 女星波多野结衣相关的网页比例占到了训练语料库的 0.5%。

人工智能
Edwards(42866)
发表于2025年09月06日 00时20分 星期六
来自美丽新世界
英国政府试用 M365 Copilot 后未发现明显的生产力提升。英国商务部获得了 1000 份许可证,可在 2024 年 10 月至 12 月期间使用。大部分许可证分配给志愿者,有 30% 分配给随机选择的参与者,其中 300 人同意对其数据进行分析。结果显示,每位用户平均执行了 72 次 M365 Copilot 操作,根据试用期间 63 个工作日计算,每位用户每天执行 1.14 项操作。Word、Teams 和 Outlook 是使用率最高的应用,而 Loop 和 OneNote 使用率非常低。最常见的三项任务是记录或总结会议记录、撰写电子邮件以及书面意见,而此类任务的用户满意度最高。但用户报告使用 M365 Copilot 完成 Excel 分析等更复杂的任务时速度比非 AI 用户更慢,质量和准确性也更差。总体而言,M365 Copilot 未发现能明显提升生产力。

人工智能
Edwards(42866)
发表于2025年09月05日 15时36分 星期五
来自风神秘抄
Anthropic 宣布,立即停止 Claude 提供给多数股权由中国资本持有的集团或其子公司使用。 这一举措意味着,凡是直接或间接由中国实体控制(占股比例超过 50%)的企业,不再被允许使用 Anthropic 的服务。该政策不仅适用于中国大陆公司,也包括那些在境外设立的子公司、云服务中转实体或具有中国背景投资主体的组织。Anthropic 在其官网公告中表示,此举为应对法律、监管与国家安全风险。Anthropic 一位高管对《金融时报》的简要说明,此举还意在遏制中国公司通过在海外(如新加坡)注册子公司或使用第三方云服务,规避出口管制以获取先进 AI 技术的可能性。这是首个美国 AI 公司公开宣布此类限制的案例,标志着在美国科技公司 AI 出口与服务限制方面,可能更加主动采取防范措施。

人工智能
Edwards(42866)
发表于2025年09月04日 18时01分 星期四
来自羚羊与秧鸡
瑞士发布了完整开源的大模型 Apertus——即不仅公开模型权重,还公开了训练数据集和文档等资料。Apertus 的源代码和训练集都允许商业使用。它的数据集包含了 15 万亿 tokens,涵盖了逾千种语言。Apertus 的开发明确遵守瑞士数据保护和版权法,纳入了可追溯的退出机制以尊重数据源的偏好。用户可通过瑞士官网访问大模型,也可以通过 Hugging Face 和 Public AI Inference Utility 访问。

人工智能
Edwards(42866)
发表于2025年09月04日 00时42分 星期四
来自星尘
腾讯发布了混元世界模型-Voyager(HunyuanWorld-Voyager),能基于单张输入图像生成具有世界一致性的3D点云,并支持用户按照自定义的相机路径进行沉浸式世界探索。HunyuanWorld-Voyager 使用了一个包含超过 10 万个视频片段的数据集进行训练,它包含两个关键组件:世界一致的视频扩散 和 长距离世界探索。腾讯发布了该模型的推理代码和模型权重。

人工智能
Edwards(42866)
发表于2025年09月02日 17时46分 星期二
来自神秘博士:阿波罗23号
Fastly 对 791 名程序员的调查发现,资深程序员和初级程序员在使用 AI 生成代码上存在显著差异。三分之一有 10 年以上开发经验的资深程序员表示他们交付的代码逾半数由 AI 生成,相比下开发经验不到两年的初级程序员中这一比例只有 13%,前者是后者的两倍半。一名资深程序员称,AI 比人类更快对代码进行组件测试并发现错误,然后无缝修复。但一位初级程序员表示对 AI 生成的代码并不那么信任,称自己需要经常重写代码。近三成的资深程序员表示编辑 AI 生成代码的时间足以抵消大部分节省的时间,而初级程序员中这一比例仅为 17%。尽管如此,59% 的资深开程序员表示 AI 工具帮助他们加快交付速度,而初级程序员中这一比例为 49%。略超过半数的初级程序员表示,AI 略微提升了开发速度。相比之下资深程序员中这一比例仅为 39%。但资深程序员更可能报告开发速度显著提升:26% 的资深程序员表示 AI 让开发速度大幅提升,是初级程序员(13%)的两倍。

人工智能
Edwards(42866)
发表于2025年08月30日 23时46分 星期六
来自尘埃记
Vivaldi CEO 谭咏文(Jon von Tetzchner)再次强调了不会在浏览器中集成生成式 AI 的立场。他的理由是相比生成式 AI,人类的 Web 更具有多元化。他说,浏览器嵌入生成式 AI 会让 Web 丧失人性,导致内容发行商的流量减少,且其主要用途是收集用户数据。他说,每一个初创公司都在搞 AI,每一家公司都试图在其产品和服务中集成 AI,但这些公司都没有关注用户的真正需求。他说,Vivaldi 选择站在人类这边,而不是选择站在炒作 AI 那边,不会将探索的乐趣变成不活跃的旁观。如果没有探索,Web 会索然无味。人类的好奇心会失去动力,Web 的多元性也会跟着消亡。他表示,生成式 AI 与社媒推荐算法面临的问题相同,它们都根据收集的数据决定用户看到的内容。但 Vivaldi 希望用户能掌控自己的数据,自主决定看到的内容,希望用户能掌控一切。如果用户想使用生成式 AI,他们可以很容易访问,并不需要浏览器去集成 AI。

人工智能
Edwards(42866)
发表于2025年08月28日 17时06分 星期四
来自假如我有完美妈妈
在 ChatGPT 发布近三年之后,大模型特有的词语在人们的日常对话中也日益流行。佛罗里达州立大学研究人员的论文预印本《Model Misalignment and Language Change: Traces of AI-Associated Language in Unscripted Spoken English》已发布在 arxiv 上。通过分析 2210 万口语单词,其中包括来自科技相关播客的对话,在 ChatGPT 发布之后,大模型的常用词在日常对话中出现的频率也越来越高。如 AI 常用词 underscore 使用量显著增加,但其同义词 accentuate 并没有增加。其它 AI 常用词如 delve、intricate、surpass、boast、meticulous、strategically 和 garner 等的情况类似。研究人员称,我们不仅仅在使用 AI;AI 时髦词正日益融入日常对话中,引发了对“渗透效应(seep-in effect)”的担忧。研究人员表示,语言是人类最强大的沟通媒介,了解 AI 如何影响这种媒介具有重要意义。

人工智能
Edwards(42866)
发表于2025年08月27日 16时35分 星期三
来自人猿泰山之绝地反击
16 岁的 Adam Raine 自杀前曾花了几个月时间与 OpenAI 的聊天机器人 ChatGPT 讨论其自杀计划。他的父母 Matt 和 Maria Raine 本周提起诉讼,指控 ChatGPT 杀死了他们的孩子。这是首例与 AI 机器人相关的过失致死(wrongful death)案。AI 聊天机器人通常都设有安全保护功能,如果用户表达出自残或伤害他人的意图,安全功能会启用。然而 AI 聊天机器人的安全功能也很容易绕过,一种众所周知的方法是要求聊天机器人从创作或世界构建等的角度谈论了一个角色。在本案中,Adam Raine 就使用该方法一步步制定了自己的自杀计划。OpenAI 通过官方博客证实 ChatGPT 的安全保障措施存在局限性。

人工智能
Edwards(42866)
发表于2025年08月25日 15时17分 星期一
来自科玛
英伟达已通知半导体后工序大企业美国 Amkor Technology 和韩国三星电子停止涉及 H20 的相关业务。英伟达也向台湾鸿海精密工业提出了类似请求。英伟达之所以对 H20 的生产持犹豫态度,是因为中国市场的需求预期正在迅速恶化。中国相关部门于 7 月对 H20 存在安全方面的漏洞提出了担忧。对于英伟达来说,H20 本应是开拓中国市场的王牌产品。在困境之下,英伟达正在摸索的方案是投放新型芯片。H20 基于上一代 Hopper 架构,英伟达据报道正基于最新一代的 Blackwell 架构开发面向中国市场的半导体。

人工智能
Edwards(42866)
发表于2025年08月23日 23时03分 星期六
来自蓝莓村
OpenAI 正致力于取代 Google,而它依赖的搜索数据却来自搜索巨人。Theinformation 报道,OpenAI 通过使用从 Web 抓取的 Google 搜索数据去增强聊天机器人 ChatGPT 的响应能力。当用户通过 ChatGPT 查询时事如新闻、体育和股市时,Google 搜索数据能提供巨大的帮助。OpenAI 使用的数据来自 Web 抓取公司 SerpApi。去年 SerpApi 还在网站上列出 OpenAI 是其客户,但后来将其删除了。

人工智能
Wilson(42865)
发表于2025年08月22日 00时05分 星期五
来自王朝启示录
Google 首次披露了其 AI 聊天机器人 Gemini 每次查询的耗电量:中位数是 0.24 瓦时。相当于一台标准微波炉运行约一秒钟的能耗。这 0.24 瓦时中,Google AI 芯片 TPU 的耗电量占了 58%,CPU 和内存占了 25%,备用机器占了 10%,冷却和功率转换等数据中心运营占了 8%。Google 计算的 AI 耗电量只针对文本生成,不涉及更复杂的如图像或视频生成等高能耗任务。Google 称,Gemini 的能耗过去一年多已经有了显著的改进,2024 年 5 月 Gemini 每次提示的耗电量中位数是 2025 年 5 月的 33 倍。能耗的改进得益于模型的改进和软件优化。Google 还公布了 Gemini 每次提示的二氧化碳排放和耗水量:分别为产生 0.03克二氧化碳和消耗 0.26 毫升水——相当于五滴水。

人工智能
Edwards(42866)
发表于2025年08月19日 22时02分 星期二
来自猛兽的财富
MIT 发表报告《The GenAI Divide: State of AI in Business 2025》称,95% 的企业生成式 AI 试验失败了。虽然企业纷纷整合大模型,但只有 5% 的 AI 试点项目实现了收入的快速增长,大多数项目停滞,对损益表几乎没有产生可衡量的影响。研究基于对 150 名高管的访谈,350 名员工的调查以及对 300 个公开的 AI 部署项目的分析。报告主要作者 Aditya Challapally 解释说,95% 的企业部署生成式 AI 表现不佳不是因为大模型的质量,而是因为 ChatGPT 之类的通用工具因其灵活性对个人用户非常有用,但它们无法从工作流程中学习或适应工作流程,因此企业部署停滞不前。逾半数的生成式 AI 预算是投入在销售和营销工具上面,但研究显示后台业务自动化投资回报率最高——在后台部署 AI 有助于消除业务流程外包、削减外部营力成本和简化运营。

人工智能
Edwards(42866)
发表于2025年08月19日 00时04分 星期二
来自奇岛
根据 Google Cloud 和 Harris Poll 的一项联合调查,87% 的游戏开发者在工作流程中使用 AI 智能体(AI agent)。这次调查于 2025 年 6 月底到 7 月初展开,询问了美国、韩国、挪威、芬兰和瑞典的 615 名游戏开发者关于 AI 在游戏行业现状以及未来发展方向等问题。结果显示,受访者普遍认同 AI 对创意工作、商业环境和内部工作流程产生积极影响,逾九成受访者表示 AI 正帮助应对一系列挑战,包括推动创新和提升玩家体验。97% 的受访者表示,生成式 AI 正重塑游戏行业,95% 的受访者表示 AI 正在减少工作流程中的重复性任务,94% 的受访者表示 AI 正推动创新。47% 的受访者表示,AI 加速游戏测试和机制平衡;45% 的受访者表示 AI 有助于游戏内容的本地化和翻译;44% 的受访者表示,AI 改进了代码生成和脚本支持。89% 的开发者认为 AI 的融入正在改变玩家的期望,37% 的受访者表示发现玩家正在寻求更真实的体验。63% 的开发者对数据所有权表达了担忧。

人工智能
Edwards(42866)
发表于2025年08月18日 14时44分 星期一
来自没有你的天堂
根据 Meta Platforms 的一份内部文件,该公司的 AI 规则允许聊天机器人与儿童调情,生成虚假医疗信息,帮助用户辩论黑人比白人笨。这份标题为《GenAI: Content Risk Standards》的文件讨论了该公司 AI 聊天机器人的行为指南。Meta 确认了该文件的真实性,但表示已经删除了相关内容。Meta 发言人 Andy Stone 称,该公司正在修改该文件,称与儿童进行调情式的对话是绝对不应允许的。

人工智能
Edwards(42866)
发表于2025年08月15日 22时42分 星期五
来自大魔法师
Google 今年初发布了首批 Gemma 3 开源(或开放权重)模型,其参数规模从 10 亿到 270 亿个参数不等。现在 Google 发布了一个更紧凑的 Gemma 3 版本,其参数规模仅为 2.7 亿,Gemma 3 270M 能在智能手机甚至能在浏览器上运行。在 Pixel 9 Pro 智能手机上进行的测试显示,Gemma 3 270M 在 Tensor G4 上执行 25 次对话,仅消耗 0.75% 的电力,它是至今最高效的 Gemma 3 版本。Gemma 3 270M 在 IFEval 测试中的得分 51.2%,高于其它参数规模更多的轻量级模型,略逊于参数规模超过 10 亿的 Llama 3.2 版本。

人工智能
Edwards(42866)
发表于2025年08月14日 21时02分 星期四
来自迷失的世界
金融时报报道,杭州深度探索公司 DeepSeek 在使用华为芯片训练新模型 R2 失败后,已推迟该模型的发布。DeepSeek 在今年 1 月释出了引发广泛关注的 R1 模型,之后它开始了 R2 模型的训练,在有关部门的鼓励下它使用了华为昇腾(Ascend)处理器而不是更成熟也更先进的英伟达 AI 芯片。但在使用昇腾芯片训练 R2 模型的过程中 DeepSeek 持续遭遇技术问题,因此转而使用英伟达芯片训练,使用华为芯片推理。

人工智能
Edwards(42866)
发表于2025年08月14日 17时20分 星期四
来自未来学大会
全世界最先进的 AI 模型都来自美国公司,都是私有模型,而中国在开源模型或开放权重模型领域处于领先地位,这令硅谷和华盛顿感到担忧,担心中国的模型可能会成为 AI 行业标准。行业标准并不一定是技术最先进的,易获得性和灵活性也非常重要,比如移动领域的 Android。对很多企业而言,使用开源模型可以对其进行更自由的调控,确保敏感信息不外泄。新加坡华侨银行使用开源模型开发了数十种内部工具,它使用的开源模型包括了 Google 的 Gemma,阿里巴巴的 Qwen 以及杭州深度求索的 DeepSeek。OpenAI 最新发布的开源模型 gpt-oss 在多项测试中不如阿里巴巴的 Qwen3,但 Qwen3 的参数规模几乎是 gpt-oss 的两倍,意味着 Qwen 可能需要消耗更多的算力完成相同的任务。OpenAI表示,gpt-oss 在推理任务上的表现优于同等参数规模的竞争对手,以低成本实现了强大的性能。亚马逊 AWS 表示,gpt-oss 比在其基础设施上运行的 DeepSeek R1 性价比更高。