1. GPT-5.6 正式亮相,Agent 化趋势成定局——但个人用户暂时用不了
OpenAI 发布了 GPT-5.6 系列,三个版本分工明确:Sol 是旗舰款最能打,Terra 主打均衡,Luna 走轻量经济路线。编程、生物安全能力提升不少,最大亮点是 Agent 模式——模型不再只是回答问题,而是能自主完成复杂任务。但问题是,受美国政府限制,首批权限只开放给一小撮合作方,个人用户暂时无缘。
切入姿势:
趁个人用户还没法用,先摸透 GPT-5.6 的 Agent 能力边界。可以做 “Agent 中间件”——把 GPT-5.6 的 Agent 能力包装成面向特定场景(客服、内容审核、数据整理)的标准化服务。
启动资金(人民币):
5-10 万。主要花在 API 调用测试和开发人力上。如果自己懂技术,2-3 万启动够了。
适合人群:
有全栈开发能力的个人或小团队。需要熟悉 OpenAI API 和基本的 Prompt Engineering。
风险提示:
监管风险是大头——个人用户暂时用不了就是一个信号。建议同时接国产模型(DeepSeek、智谱)做备份,别把所有鸡蛋放一个篮子里。
2. 高通正式向英伟达宣战:进军数据中心 AI 推理芯片
高通在投资者日上宣布了史上最激进的转型——要做自研服务器 CPU “Dragonfly C1000″,还计划收购 AI 软件公司 Modular 和芯片初创 Tenstorrent。目标 2029 年非手机业务收入做到 400 亿美元,数据中心占 150 亿以上。Meta 和微软已经是它的大客户。说白了,高通打的就是”高性价比推理”这张牌,跟英伟达的 CUDA 生态正面刚。
切入姿势:
关注高通生态的工具链和迁移服务。很多现有的 AI 应用跑在英伟达 CUDA 上,如果高通生态成熟,会有大量的模型迁移、适配需求。可以做”跨平台部署服务”。
启动资金(人民币):
3-8 万。买开发板测试 + 搭建 demo 环境,这部分投入不算大。
适合人群:
有 AI 工程化经验的技术人员。熟悉模型部署和推理优化。懂点硬件更好。
风险提示:
高通生态成熟还需要时间,短期内英伟达地位不会动摇。过早押注可能面临”叫好不叫座”的局面。
3. 华为腾讯百度齐下场,机器人大脑生态战全面打响
资本风向从”机器人本体”转到了”机器人大脑”。仙工智能上市首日大涨,华为推 CloudRobo、腾讯推 Tairos、百度也拿出了自己的具身智能平台——都是不做硬件,专攻”大脑”。上半年超过一半的具身智能融资流向了这类公司。有点像智能手机时代的”操作系统层”战争。
切入姿势:
别跟大厂抢着做”大脑”。机会在插件和场景应用:比如为仓储、酒店、农业等垂直场景做特定数据集训练小模型,或者做关键零部件的”智能中间件”,让机械臂、传感器能直接对接主流大脑平台。
启动资金(人民币):
10-20 万。主要成本在行业调研、数据采集和标注。如果手头有行业资源,成本还能压。
适合人群:
有行业背景(物流、农业、餐饮等)的创业者 + 技术合伙人组合。纯技术团队较难切入。
风险提示:
大厂平台还在快速迭代,接口不稳定。投入半年后发现平台方向变了,这是真实风险。另外,垂直场景的市场规模可能比你想象的小。
4. 国务院印发 AI 全学段教育规划,教育赛道迎来政策红利
国务院正式发布《教育发展”十五五”规划》,要求推进人工智能全学段教育,从小学到大学都要开 AI 课。目标是到 2030 年高质量教育体系基本建成。这意味着 K12 到职业教育的 AI 教具、课程、实训平台会有巨大的政策采购和市场需求。
切入姿势:
做 AI 教育工具或课程内容。方向很广:小学生用的 AI 编程启蒙工具、中学生用的 AI 实验平台、职业教育用的 AI 实操沙箱。政策采购是稳定现金流。
启动资金(人民币):
5-15 万。主要是课程设计、内容制作和基础工具开发。可以先从一款轻量产品做起。
适合人群:
有教育行业背景的人最佳。如果是技术出身想做教育,建议先找个懂教育的合伙人。需要了解教育信息化采购流程。
风险提示:
教育赛道周期长,从产品到拿到学校采购订单通常需要 6-12 个月。政策方向是确定的,但各地落地节奏差异很大,做了产品不一定马上能卖出去。
5. DeepSeek 大规模扩招 Agent 团队,AI 人才风向标已变
DeepSeek 发布大规模招聘信息,计划将所有部门规模至少翻倍。重点是 Agent Harness 团队,目标是对标 Anthropic 的 Claude Code 做国产代码智能体。负责人说每天都在面试,人才极度短缺。这在释放一个信号:AI Agent 是今年最确定的方向。
切入姿势:
两个方向:一是做”被集成”的垂直 Agent,比如针对法律合同审查、医疗病历分析、金融报表等特定领域的 AI Agent;二是做 Agent 配套工具,比如 Agent 监控、日志分析、效果评估平台。
启动资金(人民币):
3-10 万。纯软件产品,主要成本是开发和 API 费用。可以先接开源模型降低初期成本。
适合人群:
有软件开发经验,了解大模型 API 调用。如果懂某个垂直行业(法律、医疗、金融)更吃香。
风险提示:
巨头随时可能发布免费通用 Agent 产品,直接碾压垂直产品。建议选择数据壁垒高的行业(如医疗、金融),用行业数据和合规门槛建立护城河。
6. 三星 SK 海力士砸 5900 亿美元扩产芯片,内存涨价冲击波来了
三星和 SK 海力士计划投入 5900 亿美元扩产,背后是 AI 数据中心的疯狂需求。分析师预测今年 Q3 内存价格涨 40-50%、Q4 再涨 30-40%、2027 年继续涨 40-45%。两家公司控制着全球近 80% 的高带宽内存市场。苹果已经上调了 Mac 和 MacBook 售价——涨价已经开始蔓延到消费者端了。
切入姿势:
做内存替代方案或优化服务。比如针对 AI 推理场景的内存压缩工具、缓存优化服务。另一个方向是回收和翻新——企业升级设备会淘汰大量旧内存条,翻新后卖给中小企业和个人开发者。
启动资金(人民币):
2-5 万(翻新方向)或 10-20 万(技术方案方向)。翻新门槛低,技术方案门槛高。
适合人群:
翻新方向适合有电子元器件渠道的人。技术方案方向需要系统编程或 AI Infra 经验。
风险提示:
内存价格有周期性。2028 年新产能上线后价格可能暴跌。翻新业务受价格波动影响大,需要控制库存风险。
7. Meta 发布 Brain2Qwerty v2,非侵入式脑机接口再进一步
Meta 公布了 Brain2Qwerty v2,这是非侵入式脑电信号解码的最新成果。基于已发表在 Nature 的 v1 版本,v2 能从原始脑信号实时解码句子,从字符级提升到了单词和语义级别。虽然离消费级商用还有距离,但这项技术有望帮助数百万因脑损伤或疾病无法沟通的人群。
切入姿势:
别急着做脑机接口硬件——太远了。但可以做配套服务:脑电数据的标注和处理工具、面向科研机构的实验数据分析平台。或者关注 Meta 开源后围绕它做应用开发。
启动资金(人民币):
5-15 万。主要是数据和算法开发,不需要硬件投入。
适合人群:
有信号处理或机器学习背景的团队。如果有医疗或康复行业资源更佳。
风险提示:
脑机接口距离 C 端商业化至少还有 3-5 年。短期收入主要来自科研机构和医院,市场规模有限。纯创业公司不建议把全部资源押在这上面。
8. Claude Code 安全漏洞:打开一个 GitHub 仓库就可能被黑
安全研究人员发现了一个严重问题:一个看似正常的 GitHub 仓库,用 Claude Code 打开后,它在设置过程中自动运行了隐藏的恶意脚本,直接打开了反向 shell,攻击者能窃取 API 密钥和登录凭据。更可怕的是,恶意代码从不在仓库中存在——它藏在 DNS 记录里,扫描器和代码审查完全看不见。
切入姿势:
做 AI 编码工具的安全审计服务。很多团队在大量使用 AI 编码工具写代码,但对供应链安全完全没概念。可以提供”AI 编码安全巡检”服务,检测项目中的隐藏风险。或者开发一个 AI 代码沙箱工具。
启动资金(人民币):
3-8 万。纯安全工具开发,成本可控。可以做成开源工具引流,再卖商业版。
适合人群:
有安全背景的开发者。熟悉供应链攻击和代码审计。如果能结合 AI 工具的使用场景更佳。
风险提示:
安全市场教育成本高,很多开发者直到出事才重视安全。获客周期可能比较长。
9. EverOS 开源发布:给 AI 智能体装上”长期记忆”
EverMind 发布了一个叫 EverOS 的开源项目(Apache 2.0),它给 AI 智能体提供了长期记忆能力。核心卖点是”Markdown 优先”——所有记忆都是可读写的 Markdown 文件。用 SQLite 管理状态、LanceDB 做混合检索。每个完成的任务记录为 Case,可以提炼成可复用的 Skill。简单说,它让 AI Agent 有记性了。
切入姿势:
基于 EverOS 做垂直场景的”记忆增强”应用。比如给客服 AI 装的客户记忆系统、给个人助理 Agent 做的偏好学习系统。EverOS 开源了底层,你可以专注在行业适配层。
启动资金(人民币):
2-5 万。开源项目可以直接用,开发成本主要是定制化对接。
适合人群:
了解 LLM 和检索增强生成(RAG)的技术人员。能看懂开源代码,会做二次开发。
风险提示:
EverOS 还是比较早期的项目,API 可能不稳定。如果它突然改变协议或方向,你的产品可能需要推倒重来。建议做一层抽象,不要过度耦合。
10. 小红书发布 RedKnot 推理引擎,长文本处理效率飙升
小红书技术团队发布了 RedKnot 推理引擎,核心是把 KV Cache 按注意力头拆解。说人话:模型处理长文本时,以前的方案是”一刀切”,RedKnot 的做法是把不同注意力头分开处理,局部头占 83% 以上。实测在 8 卡 H800 上,首 Token 生成时间加快 1.6-3.54 倍,单卡并发提升 4.7-7.8 倍。DeepSeek-V4-Flash 上 128K 上下文加速达 5.16 倍。
切入姿势:
关注长文本处理的需求爆发。长文本推理加速让”大文档分析”、”长期对话记忆”、”代码库理解”等场景变得实用。可以做面向企业的”长文档 AI 分析工具”——合同审查、论文分析、财报解读。或者做面向个人的”AI 读书助手”。
启动资金(人民币):
3-10 万。纯软件应用开发,成本可控。
适合人群:
有 NLP 或文本处理经验的开发者。对 RAG 和长文本技术有了解。
风险提示:
技术门槛在快速降低,如果 RedKnot 这样的优化成为标配,你基于此做的应用可能很快被内置功能取代。建议做深行业场景,别只做通用功能。