Skip to content

Latest commit

 

History

History
95 lines (53 loc) · 6.76 KB

README.md

File metadata and controls

95 lines (53 loc) · 6.76 KB

Ai01

近期AI领域事件短评(2024-2-27)

手机root

https://www.miui.com/unlock/index.html

https://www.youtube.com/watch?v=tibiujxNTfE

channel

https://www.youtube.com/@banpie

Jojo AI, 课程大纲可参见 https://99ai.teachable.com/courses/jojo-ai/lectures/46947010

加密

https://www.reddit.com/r/real_China_irl/comments/zan4r7/%E5%9B%BD%E5%86%85%E4%BD%BF%E7%94%A8telegram%E7%9A%84%E5%AE%89%E5%85%A8%E6%80%A7%E8%A7%A3%E6%9E%90%E8%BD%AC%E8%87%AAiyouport/

开源,在桌面电脑就能跑的大模型,搭建私人专属的 LLM 大语言模型聊天机器人, 视频介绍参见 https://www.youtube.com/watch?v=gKmawmUw7Jo

https://www.freedidi.com/11195.html

2024年AI

趋势: 所有的APP 都值得用 大模型来重做一遍。

三个关键词: 知识库, 多模态,Agent

openAI Sora

AIGC新里程碑!OpenAI官宣最强视频生成模型Sora,能理解和模拟现实世界,GPT5前瞻 2月16日,OpenAI发布视频生成模型Sora,能理解和模拟运动中的物理世界

Sora涌现:OpenAI又一次暴力美学的胜利

AI投资

2024,中国乐观派们如何投 AI?

现阶段,我们将模型层的公司分为三类。

第一类是基础模型公司,它们类似于建造电厂,旨在让其他企业接入并使用其服务,代表公司如 OpenAI 和智谱 AI。

第二类是开源模型运营平台,它们提供开源模型、模型优化和托管等服务,如 Hugging Face 和中国的阿里云魔搭社区。

第三类,我们最初称之为垂类模型,但现在更适合称其为模型应用一体化公司,这些公司直接利用自研模型去开发自己的垂直行业类或特定功能类应用。

Q4:这一代大模型相关的 AI 创投浪潮与上一代会有什么区别? 周志峰:这一次是以预训练模型驱动的生成式 AI 为主,上一代主要是以感知为主的判别式 AI。 判别式 AI 的核心特点主要有两点:

  • 第一,它主要是进行视觉和语音的判断,而无法进行深层推理,它的应用场景较为有限,主要在人脸识别、物体识别、语音识别、基于视觉的智能驾驶等任务上取得了较大的发展。
  • 第二,上一代 AI 模型需要为特定任务定制,其泛化能力有限。

这也是为什么在过去 10 年中,人工智能企业在技术落地时会遇到较大挑战的原因,因为它们需要为不同场景组建不同的团队。例如,很多人认为酒店入住时的人脸识别系统与公共场所的基于人脸识别的智能安防系统的功能相似,然而,从模型构建、训练到部署,以及芯片和摄像头等配套硬件上,两者存在显著差异。

之前的十年,人工智能技术主要在三个场景取得了规模化应用的成功: 第一个是互联网的推荐系统,代表公司是字节跳动; 第二是智慧城市,市场体量足够大,只有场景体量大才能形成闭环迭代,不断降低成本和提升性能; 第三是智能驾驶,比如特斯拉通过几百万辆车完成了软硬件生态的闭环迭代。

对于未来可能出现的大应用场景,目前我们暂时认为有三类: 第一类是使用AI提升生产力效率的场景,如针对特定行业或领域的软件工具,自动化重复性任务、提供决策支持、优化资源分配; 第二类是泛娱乐领域,包括游戏和其他创新型人机互动、内容生成的娱乐应用; 第三类是变革信息流转方式的创新应用。

2022 年底,我们有一个判断:AI+3D 交互+Robotics,叠加底层的 Web3 技术,三浪叠加掀起生产力革命。这个是蓝驰看 AGI 的底层逻辑。 之前的互联网是二维的,人类处理的都是二维空间的数据;但是从人工智能开始,我们要处理的是三维空间,也就是立体的空间数据。当 AI 能够获取 3D 数据,它进阶的速度会加快。而机器人则是重要的执行终端。 现在可能还是互联网时代的 2000 年以前。从细节行业不同环节的价值来看,这一波的 AI 浪潮下的底层基础设施在未来的占比,可能会比互联网更高一些。

Q7:这一代 AGI 创投与上一代 AI 有什么不同? 朱天宇:在人工智能中,最值得期待的就是 NLP 的突破——NLP 是认知的入口,是基于语言文字的积累,能够调动的存量知识足够多,且跟人的交互更频繁、更接近行业应用。一旦 NLP 完成了突破,人类就可能「勾」到更高级的数据场景,训练出更高级的 AI。大语言模型的出现就是这样的突破。 上一代的信息革命、互联网,其实还是在传输信息,而这一代的 AI 是创造信息——例如 GPT——是在生成;之前的很多商业模式都是基于连接的,而接下来的商业模式是基于创造,所以就有一定的价值分配问题。之前的人机协作更像 SaaS 服务,但是接下来的人机协作很可能是机器会介入到人类的的思考和生产流程中,是有来有往的,不再只是外挂、辅助式的。

绿洲资本一直以来都非常看好 Agent 领域,所有的软件都会因其被重塑。2023 年一年这个观点还没有得到证实,主要原因是业界还没有找到爆发性的应用场景。 我们认为现在还没有到临界线,还需要继续寻找爆发点。 绿洲资本依然对这个领域持乐观态度,认为它是今年的一个重点方向。 此外,绿洲资本在人形机器人领域也进行了很多研究和投资。虽然大家都说人形机器人与 AI 的结合是未来的趋势,但目前来看,这个结合点还不够紧密。这可能是因为机器人本身的反馈系统和传感器的精度与 AI 的结合还存在一些差距。

现在美国是全球生成式 AI 最大的企业级应用市场,但中国有望成为全球最大的生成式 AI 消费级应用市场。

当前,许多大模型都采用了 MoE 架构,包括 Sora 和 Gemini 1.5 Pro 等。与传统的作为一个庞大的神经网络运行的 Transformer 不同,MoE 模型由众多小型的「专家」神经网络组成,结果是大幅优化了推理效率和成本。 我们认为 MoE 架构的普及有可能会打破目前大模型领域闭源与开源的格局,让开源大模型迎来新的发展机遇——MoE 的每个专家模型都很小,开源社区完全可以「拼齐」这些模块;或基于开源的 MoE 大模型,针对一两个专家模型做对应的优化,从而提升其在某个专业领域的能力。这大幅降低了开源模型在算力、数据、资本等资源上的劣势对其发展的影响。