项目架构 (基于大模型语言):

1、后端模型:利用ollama平台的Qwen, Deepseek模型为聊天机器人提供核心的对话处理功能。

2、前端界面:采用Streamlit框架搭建用户界面,能够快速创建美观、交互式的web应用。

3、对话交互:用户可以通过Streamlit界面输入文本,聊天机器人基于Qwen模型对输入内容进行理解和处理。

4、模型调用:后端服务负责将用户输入传递给Qwen模型,并获取模型生成的回复。

5、界面展示:Streamlit界面提供简洁明了的布局,包括输入框、发送按钮和对话展示区域。

 

大模型核心基础

概念:大模型,通常指的是“大语言模型”LLM,它是一个通过在海量文本数据上训练、能够理解并生成人类语言(自然语言NLP)的超大型人工智能程序。

分类:

1、自然语言处理(NLP)模型

让机器理解、生成和处理人类语言。核心任务包括文本分类,翻译、问答、情感分析等。

2、计算机视觉(CV)模型

视觉大模型核心是通过大模型数据和复杂模型架构,实现对图像和视频的深度理解和生成。能够处理复杂的视觉任务,如图像分类、目标检测、语义分割、图像生成等。

3、语音模型

语音模型是将声音信号转化为数字信号的模型,主要用于处理语音相关的任务,如语音识别、语音合成等。

4、多模态模型

多模态模型是一种能够同时处理多种数据模态(如文本,图像,音频,视频等)的人工智能模型。例如医疗诊断、自动驾驶、智能助手等。

 

 

 

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐