高考作文又成为了备受关注的热点,AI时代也进入了高考作文内容中,新课标I卷的题目:

随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?

以上材料引发了你怎样的联想和思考?请写一篇文章。

要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

恰好今天阿里云通义千问发布Qwen2开源大模型,最新版本Qwen2有以下特点:

5种模型规模,包括0.5B、1.5B、7B、57B-A14B和72B;

针对每种尺寸提供基础模型和指令微调模型,并确保指令微调模型按照人类偏好进行校准;

基础模型和指令微调模型的多语言支持;

所有模型均稳定支持32K长度上下文;Qwen2-7B-Instruct与Qwen2-72B-Instruct可支持128K上下文(需额外配置)

支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent等;

加上早两天的智谱AI开源的GLM-4系列:“全面升级的新一代基座大模型GLM-4,整体性能相比GLM3提升60%,支持128K上下文,可根据用户意图自主理解和规划复杂指令、完成复杂任务”

国内AI大模型又进入新一轮的模型开源竞赛,根据他们的宣传比上一代都有显著的提升,要知道上一代Qwen1.5发布时间是2月6号,这才刚刚过去了4个月,而智谱的ChatGLM-3开源时间在去年10月份,两代相隔也只有8个月。那放眼国外有Llama 3是Meta于4月发布,谷歌的Gemma-7B也在2月开源,还有很多开源大模型如Phi-3、deepseek-v2等等,都有不错的表现,接下来各个大语言模型排行榜又要迎来新的一轮更新。

很多排行榜还没来得及更新,期待他们后续表现

中文大模型能力评测榜单:github.com/jeinlee1991…

image.png

那从一众开源大模型引入我们今天的话题,开源大模型本地部署+高考作文的表现

Qwen2高考作文表现如何?

iShot_2024-06-07_14.26.54.png

首先我让本地部署的Qwen2-7B分析一下作文题:首先请从高中语文的角度分析一下这个题目。

然后让他扮演扮演一位高考学生,根据分析写一篇优秀作文

iShot_2024-06-07_14.28.22.png

可以看到虽然我只用了Qwen2-7B,还没有上Qwen2-72B,但效果已经非常不错,推理速度很快,文章分析思路和质量都是在线水平,我不是高中语文老师,这里不做打分,只对技术使用进行主观评判。

那我用同样的问题问chatgpt-4o的结果如下:

image.png

image.png

可以简单对比一下,开源Qwen2-7B和OpenAI的最新商用大模型chatgpt-4o的区别,我这里不进行评判。

接下来说重点,那既然本地部署的开源模型在某些方面似乎也能够勉强达到商用大模型的效果,是不是以后开源本地部署方案会不会逐渐成为一种主流呢?私有化部署和调用商用线上大模型的区别和接下来生态的发展走向会是什么样呢?最核心的使用不同方案的成本如何呢?

私有化部署大模型是不是趋势?

我最近一直在研究一套能够 拔网线断WIFI 也能使用大语言模型能力的解决方案,希望能够简单上手部署,也能够方便使用,还不用花多少钱成本,这样我无论在何时何地都能够用来提升工作、学习生活的效率,简单点说就是没有续航焦虑。

大模型带给我们的不应该是焦虑,而应该是随手可使用,就像喝水一样容易,那我目前探索的这一套方案是这样:ollama + Qwen2-7B + open-webui

image.png

除了聊天对话翻译,还可以对文档进行问答、总结,这都是在 拔网线断WIFI 的前提下进行的,再加上stable-diffusion的画图能力,基本上就能够搭建一个本地个人大模型工作站了。我们暂时不谈大模型尺寸导致的效果不及预期这个问题,因为按照文章开头说的发展情况,接下来的开源大模型能力只会越来越强,我们只要紧跟发展的步伐,及时享受AI时代的红利即可。

当然更多私有化大模型的预训练和微调、垂直行业大模型的定制开发不在本次讨论范围内,不讨论但不代表没有人在做,只是还没有到全面爆发的时机,目前大模型应用还处在非常早期的探索阶段,咱先从最基础的开始玩起来,玩明白基础版了再去玩高级版也不迟😄

为什么需要拔网线断WIFI?

在将大模型进行私有化部署时,拔网线或断开Wi-Fi可以在一定程度上增强系统的安全性。主要原因包括:

  1. 防止数据泄露:大模型通常需要访问并存储大量敏感数据,如用户信息、业务数据等。断开网络连接可以防止这些数据通过网络渠道意外或故意泄露。
  2. 防范网络攻击:未联网的系统不容易成为网络攻击的目标。这些攻击包括但不限于DDoS攻击、恶意软件感染、远程代码执行等。通过物理隔离,可以大幅度降低攻击面和被攻陷的可能性。
  3. 控制模型访问:通过拔网线或断开Wi-Fi,只有具有物理访问权限的人才能接触到系统,从而增强了对模型使用和数据访问的控制。
  4. 审计与合规:某些行业和场景下(如金融、医疗、政府机构等)对数据安全有非常严格的要求。物理隔离可以帮助满足这些合规性要求,降低违规风险。
  5. 防止未经授权的更新或配置更改:联网系统可能会自动进行软件更新或配置更改,这可能带来不可预知的风险。断开网络能确保系统状态的稳定性和可控性。

当然,断开网络连接并不是唯一的安全措施,而是众多安全措施中的一个环节。实现全面的系统安全还需要结合其他措施,如加密、访问控制、日志监控等。
在这里插入图片描述

如何学习AI大模型?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐