斯坦福报告:AI圈内人与公众之间的鸿沟日益加大
斯坦福大学最新AI指数报告显示,AI专家与公众对AI的看法正在急剧分化。84%的AI专家相信AI将对医疗产生积极影响,但公众仅有44%持此观点;73%的专家对AI提升工作效率持乐观态度,公众仅为23%。专家关注AGI的可能性,公众更担心就业和电费等实际问题。
2026年4月14日 · 周二
斯坦福大学最新AI指数报告显示,AI专家与公众对AI的看法正在急剧分化。84%的AI专家相信AI将对医疗产生积极影响,但公众仅有44%持此观点;73%的专家对AI提升工作效率持乐观态度,公众仅为23%。专家关注AGI的可能性,公众更担心就业和电费等实际问题。
N-Day-Bench是一个评估前沿大语言模型发现真实世界漏洞(N-Days)能力的基准测试。题目按月更新,模型集升级到最新版本,所有模型在相同条件下测试以防止奖励黑客。这是衡量LLM网络安全的实用基准。
GitHub推出Stacked PRs功能,将大型变更分解为小型、可审查的PR链。每个PR代表一个独立的变更层,可以单独审查并一次性合并。还提供gh stack CLI方便本地工作流管理,支持级联rebase,一键创建PRs,并支持AI Agent集成。
AMD推出GAIA框架,可在本地硬件上使用Python和C++构建AI Agent。无需云端依赖,数据不会离开设备。支持文档问答、语音交互、代码生成、图像生成等多种能力,针对AMD Ryzen AI的NPU和GPU进行了优化。
Cloudflare推出cf CLI(技术预览版),统一其近3000个API操作。还发布Local Explorer,可在本地调试KV、R2、D1等资源。cf基于TypeScript架构生成,可同时为人类和AI agents提供一致的命令行体验。
Obsidian是本地优先的笔记和知识管理工具,所有数据保存在本地Markdown文件中,避免了数据锁定风险。支持双向链接、Canvas、Graph View等高级功能,社区活跃,插件丰富。适合内容创作、知识管理、项目管理和个人知识库的构建。
文章揭示AI提升生产力背后的真实代价:AI生成的代码需要人类以生物速度进行审查,88%的"最高效"AI用户出现burnout,工作效率越高的人越可能离职。提出了"监督税"问题——AI让初级工程师可以快速产出,但高级工程师的审查负担急剧增加。