早谈AI资讯：OpenAI全员乱斗Q*，英伟达H20推迟到明年初发布，李沐大模型公司细节曝光

AI行业信息 OpenAI Q*模型人工智能深度学习强化学习

发布于 5 个月前

👉👉原文链接👈👈

阅读详细图文，可访问知识库

"行业动态"板块中：

- 引爆了OpenAI全员乱斗的Q*到底是什么？

- OpenAI内部的秘密：奥特曼重新担任首席执行官，并引发了一场人工智能社区中的涟漪。

- Ilya Sutskever领导的团队通过名为Q的模型取得突破，能够解决基本的数学问题。这一模型结合了Q-learning和A搜索，具备逻辑推理和解决基本数学问题的能力。

- Qlearning的关键在于平衡探索和利用，是强化学习中重要的步骤。Qmodel的突破采用RLHF方法进行训练，从人类反馈中学习，而非仅依赖于预定义数据集。

- 这一技术发展可能是通用人工智能的里程碑，有望克服大模型的局限性，是迈向通用人工智能的一步。

尽管有人对Q的突破感到兴奋，但也有人对其功能表示怀疑。OpenAI尚未回应外界猜测，引发了AI界对Q*模型突破的不同反应。

◇ 外媒：英伟达特供芯片 H20 推迟至明年一季度发布 🔗 News

英伟达因「服务器制造商在集成芯片方面遇到问题」的原因，决定推迟在中国市场推出的性能最强的 H20 芯片，预计将在明年初发布。此次延迟可能影响英伟达在本土市场的份额，因为 H20 在中国市场具有重要意义。然而，公司其他计划，包括符合美国新出口规则的 L20 芯片，将不受延误的影响。H20、L20 和 L2 是英伟达最新设计的芯片，主要用于人工智能的训练、推理和端侧应用。

尽管特供版芯片的计算能力可能有所削减以符合美国规定，但英伟达在中国人工智能芯片市场仍占据超过90%的份额。此次推迟的原因可能与美国出口限制有关，导致英伟达加速推出符合规定的芯片来维持国内市场份额，尤其是在中国市场对其至关重要的情况下。同时，中国本土芯片厂商在美国出口限制下赢得订单的机会增加了市场竞争的动态。

李沐和Alex Smola创立了Boson.ai，专注于AIGC领域，目标是通过大型模型实现创意游戏内容生成、语音命令控制，并强化NPC的人工智能。公司初期保持低调，但最新发展表明他们将专注于游戏引擎并已招募了一名游戏专家加入团队。李沐和Alex在人工智能领域的声望以及他们在Marianas Labs的成功创业经历，使Boson.ai备受瞩目。即将召开的MEET 2024会议可能为公司提供展示最新进展的机会，描绘这一融合人工智能与游戏领域的创新力量更广阔的未来。

◇ 代码到陪伴：AI女友崛起的新闻 🔗 News

随着人工智能的进步，AI伴侣从简单工具变成了提供情感支持和陪伴的人类朋友。通过复杂算法和自然语言处理，这些机器人能够理解人类需求，并模拟人的反应，满足社交焦虑或孤独感。然而，这种技术应用也引发了一些伦理问题和隐私担忧，强调了负责任地开发和使用人工智能的重要性。尽管技术上有挑战和机遇并存，但情商算法的进步为理解和学习用户情感提供了可能路径，但也需要应对复杂的人类情感。随着AI伴侣的接受反映了技术融入生活的新文化趋势，平衡人工智能与真实人际关系培养成为未来社会规范的一部分考虑。

展望未来，随着技术不断进步，AI女友可能会在虚拟治疗和个性化生产力等方面发挥作用。然而，在这一变革中，我们需要谨慎对待技术发展的机遇和挑战，以确保人类情感和社会关系得到妥善维护。

马毅团队研发出白盒Transformer模型，这标志着可解释的大规模语言模型时代即将到来吗？

在ChatGPT引领的人工智能浪潮之后，一些研究人员认为大型语言模型虽然能够观察到因果关系，但在新的场景中却缺乏主动推理能力。而马毅教授领导的研究团队则提出了一种新的深度网络架构——CRATE（Causal Representation and Approximate Reasoning Transformer）。这项新方法是一款白盒Transformer，在各种任务上能与黑盒Transformer竞争，并具有出色的可解释性。

研究围绕表示学习展开，强调高质量的重要性。引入了稀疏率降低（SRR）作为统一的目标，以实现紧凑和结构化的表示学习。CRATE架构遵循SRR目标，是一种完全可解释且数学上合理的深度网络。实验结果表明，在图像和文本数据的评估中，CRATE与黑盒方法竞争，并展现出了出色的解释性、特征语义以及跨各种任务的适用性。

这项研究不仅弥合了理论与实践之间的差距，也为更完整和统一的框架提供基础，展示了在现实世界任务中的有效性。

小羊驼团队的新研究展示了“Lookahead Decoding”算法的重大突破，它显著提升了语言模型（LLM）的预测速度。通过使用 LLaMa-2-Chat 7B 模型，该算法在演示中将预测100个token的速度提高了1.5-2.3倍，大大缩短了响应用户问题的时间，提高了LMM推理效率。

Lookahead Decoding是一种并行解码算法，它通过打破自回归解码中的顺序依赖性，主要利用雅可比迭代方法。该算法无需草稿模型或数据存储，减少了解码步骤，加速了LLM推理。此外，该实现与Hugging Face的转换器兼容，为用户提供了增强使用Hugging Face生成的模型性能的简单途径。

Lookahead Decoding是基于其利用雅可比迭代同时解码未来标记的能力，通过收集和缓存雅可比迭代生成的n-gram以及验证有希望的n-gram，加速了解码。这一算法无需外部源，即可立即生成和验证大量n-gram，提高接受更长n-gram且减少延迟的可能性。

视觉引导的 Prompt！无需训练或微调，即插即用 🔗 News

IDEA 研究院在 IDEA 年度大会上展示了基于视觉提示（Visual Prompt）的目标检测模型 T-Rex。T-Rex 通过图像框选的 Prompt 方式，能轻松检测同一类别的物体，特别擅长处理复杂和小尺寸的物体。与其他依赖文本 Prompt 的方法不同，T-Rex 采用图像换图的方式，在处理复杂场景时更为有效。

该模型支持三种进阶模式：多轮正例模式、正例+负例模式和跨图模式，以提高检测准确性和适用性。由图像编码器、提示编码器和框解码器组成，具备开箱即用、交互式的独特特点。大会还分享了低空经济项目、Think-on-Graph 知识驱动大模型、MoonBit 开发者平台、ReadPaper 2.0、SPU 机密计算协处理器、HiveNet 可控人像视频生成平台等研究成果。

地址：trex-counting.github.io/

◇ 人类考92分的题目，GPT-4只能考15分 🔗 News

在新的GAIA测试中，GPT-4只获得了15分。相比之下，人类得了92分。GAIA是包含466个任务的一组基准测试，旨在评估人工智能系统处理一般助理问题的能力。其中包括日常和科学任务。尽管配备了工具，但GPT-4在GAIA上的成功率不足30%，而人类的平均成功率为92%。

GAIA测试被认为是评估t-AGI系统的关键里程碑，人类通常需要6分钟回答最简单的问题，17分钟回答最复杂的问题。AutoGPT-4虽然允许自动使用工具，但在Level 2和Level 1的结果令人失望，比没有插件的GPT-4还要慢。尽管GPT-4在替代搜索引擎方面有潜力，但其性能仍需进一步评估。

总体来看，人类在GAIA测试中表现出色，而当前最佳大模型的表现相对较差。GAIA有望成为评价有能力AI助手的清晰排名标准，未来可能还有改进空间。

1. 字节跳动将关闭朝夕光年，全面退出游戏业务

据知情人士透露，字节跳动计划逐步关闭其主要游戏品牌朝夕光年，并且计划全面退出视频游戏领域。字节跳动将在近期公布这一计划，并通知员工在年底前停止开发未发布的游戏项目。

此次宣布的调整措施还包括解散在研项目、正式通知和解约合同签署，以及赔偿N+1、年终奖和股权等福利。此外，字节跳动正在寻求以不低于50亿美元的价格出售其游戏部门沐瞳科技，并聘请高盛作为财务顾问协助寻找潜在买家。

2. 字节跳动与华东师大联合提出自进化文本识别器

大型语言模型（如GPT-4和Llama）在各个领域表现出卓越性能，无需模型微调。然而，场景文本识别面临多样化、文本布局、光照变化等挑战，传统方法需要大量计算资源。

字节跳动和华东师范大学开发的E2STR（自进化场景文本识别器）是一种具有上下文学习功能的文本识别器，适应不同场景而无需微调，具备高效的资源利用。E2STR的训练包括基本文本识别和情境训练，通过上下文提示池进行上下文推理，展示了在传统文本识别、跨域场景和困难样本校正上的卓越性能。

未来展望显示，即使是小型模型也能通过适当的训练和推理策略拥有上下文学习能力，推动了小型模型在实时任务中的发展。

## 人工智能的“教母”都在哪里？

在 OpenAI 风波中，奥特曼团队的性别失衡引发关注。员工签署的复职信显示超过75%为男性，与麦肯锡报告中的数据相符。2022年人工智能现状报告显示女性在领域内几乎处于缺席状态。

英语国家人工智能新闻中，男性引用频率是女性的3.7倍，仅有4%的科学、技术、资金发现新闻以女性为中心。对女性的需求、担忧和经历了解不足。尽管美国更关心人工智能的发展，但其地位相对边缘化。

专家表示，为了避免嵌入偏见，人工智能领域需要更多女性的参与。使用人工智能来纠正性别偏见被认为是解决多样性缺陷的有效方法。

## 中国为何要制造人形机器人？

为了应对人口老龄化和社会独居问题，陪伴机器人成为缓解孤独感的潜在疗法。在2023年机器人大会上，Ex Robots CEO李博阳强调老年人需要陪伴机器人。该公司利用人工智能和硅基人造皮肤等先进材料制造人形机器人。

伴侣机器人适用于老年人和年轻一代应对孤独和心理健康问题。中国有超过9200万成年人独居，占总人口的6%以上。有超过2000万20岁至39岁的年轻人也独居，原因包括经济负担和社会压力。伴侣机器人可能在中国变得普遍，并为日常任务提供陪伴和帮助。

虽然伴侣机器人解决社会孤立问题有趣，但成本、可及性和安全性仍然存在担忧。人形机器人在重塑社会动态和应对老龄化和孤立人口挑战方面发挥关键作用。技术、社会需求和人类对联系的追求是未来机器人在社会结构中扮演重要角色的关键因素。

## 融资快讯

◇ 「银牛微电子」完成超5亿元A轮融资，由合肥产投和精确资本领投。专注于视觉处理、多传感器融合和人工智能芯片设计，拥有全球领先的3D视觉感知处理引擎。融资将主要用于加速新一代芯片和模组研发、新领域产品解决方案研发，以及团队发展建设。

银牛微电子计划在全球范围内应用其芯片及产品解决方案，并与合肥高校和科研院所合作，吸引培养全球高科技研发人才。

◇ PlugBear：将ChatGPT等LLM连接到其他在线工具和服务。简单设置过程，添加频道和应用，连接通讯频道和LMM应用，定义AI触发条件，一次开发多处连接。

PlugBear官网：plugbear.io/

Github: github.com/run-llama/ragv2

## 技术阅读

◇ 使用Mistral-7B 和 LangChain构建自己的RAG。使用本地模型可以启用聊天机器人处理数据，并确保数据不会离开计算机，非常适合隐私为中心的用例。

blog: medium.com/@thakermadh

Duet AI 将迅速完成您的谷歌 Cloud任务 🔗 Link

更快地启动并加入 Google：提供快速解答初学者或有经验的用户关于产品信息、任务指南以及产品比较的问题。逐步支持数据迁移等特定任务，并提供服务选项的帮助。

生成编程脚本、gcloud命令、查询和代码：能够生成多种编程语言、SQL 查询、gcloud 命令及脚本，适用于新手编码和经验丰富的开发人员。支持生成 gcloud 命令和配置文件，帮助理解复杂的命令行语法。

了解 Google Cloud 环境：可解释和总结代码、查询、模拟结果、日志和系统错误，并提供自然语言摘要以简化复杂内容。给出解决常见问题的建议，如认证、配额、计费错误。

提升使用效果的专业提示：在 Duet AI 聊天中使用专业提示，例如产品比较和分步指南，利用辅助开发功能获取代码自动完成等帮助。在提示中提供具体的上下文和内容以获得更准确、有用的输出。

Duet AI 持续改进中，用户可通过反馈帮助优化系统。通过控制台工具栏中的“打开 Duet AI”按钮开始使用 Duet AI 聊天，获取更多信息可访问 Google Cloud 网站，包括文档和演讲。