系列文章目录

提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
第一章 如何安装
第二章 如何使用百度AIStudio
第三章 明星产品之PPOCR
第四章 科学计算
第五章 如何推理(待更新)
第六章 如何训练(待更新)
第七章 如何部署(待更新)


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

从模型开发,到训练, 直到部署,飞桨框架提供了端到端的解决方案。尤其飞桨新一代框架3.0是面向大模型、异构多芯进行专属设计,向下适配异构多芯,充分释放硬件潜能;向上一体化支撑大模型的训练、推理。同时具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力,全面地提升了服务产业的能力。获得了产学各界的诸多关注。有了好的技术,如何真正上手,将其技术能力用起来,成为大家当下最实际的诉求。
本人参加了【飞桨框架3.0实测季-官方带队实测,阶梯式解锁飞桨框架3.0能力新特性,轻松上手!】里面有非常详尽的介绍,详细内容在更新中,感兴趣的同学可以参考学习。
https://github.com/PaddlePaddle/Paddle/issues/69471
另外,AIstudio有大量的公开课程,可以方便学习,有些课程虽然过期了,可以联系客服,申请重新开启,或者进行新版本的课程学习。


一、如何安装?

请参考官网
http://preview-pr-6948.paddle-docs-preview.paddlepaddle.org.cn/documentation/docs/zh/develop/install/pip/linux-pip.html
另外通过微信可以观看视频(电脑微信不可以哦)
https://weixin.qq.com/sph/ARXsNaF5E

二、如何使用百度AIStudio?

这里推荐一篇文章,请参考:
https://blog.csdn.net/Tisfy/article/details/132535648
右边启动环境在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

另外,首月有促销,大概25块左右,送1000A币,可用于训练。做学习差不多够用了。

三、明星产品之PPOCR

在这里插入图片描述
《PaddleOCR 2.9 发布,正式开源文本图像智能分析利器》,文本图像版面解析实现高精度实时预测,低代码全流程开发加速产业应用。集成文本图像矫正、版面区域检测、常规文本检测、印章文本检测、文本识别、表格识别等多功能。6条模型产线一键调用,显著降低开发成本。支持高性能推理、服务化部署和端侧部署等多种部署方式。10月24日(周四)19:00直播为您深度解析最新升级亮点。

支持文档场景信息抽取v3PP-ChatOCRv3-doc、基于RT-DETR的高精度版面区域检测模型和PicoDet的高效率版面区域检测模型、高精度表格结构识别模型SLANet_Plus、文本图像矫正模型UVDoc、公式识别模型LatexOCR、基于PP-LCNet的文档图像方向分类模型

https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html
上述链接甚至只需要几行代码即可实现高速高精度OCR识别。
本人正在做pytorch大系统中的ocr模块集成,目前的思路是到处onnx,然后在进行部署。ppocr包含大量预处理工具,正在尝试在模型forward中集成这些预处理,实现端到端的ocr识别。等实现后,再更新。

四、科学计算

https://github.com/PaddlePaddle/PaddleScience
PaddleScience 是一个基于深度学习框架 PaddlePaddle 开发的科学计算套件,利用深度神经网络的学习能力和 PaddlePaddle 框架的自动(高阶)微分机制,解决物理、化学、气象等领域的问题。支持物理机理驱动、数据驱动、数理融合三种求解方式,并提供了基础 API 和详尽文档供用户使用与二次开发。
除了github中提供的大量实例,一个薄板变形的案例也可以参考,可以通过notebook进行在线尝试实践:
https://aistudio.baidu.com/projectdetail/8393914

五、如何推理

大模型推理,可以参考
https://github.com/PaddlePaddle/PaddleNLP/blob/develop/llm/docs/predict/inference.md
另一个text to image可以参考
https://github.com/PaddlePaddle/PaddleMIX/tree/develop/applications/text2image

六、如何训练

此次更新更好地只吃了自动并行训练,可参考
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/paddle_v3_features/auto_parallel_cn.html
如果官方说明看起来比较冗长,可以参考
https://gist.github.com/zhiqiu/5cd93e386237eadc203693d49bc21079

七、如何部署

https://gist.github.com/zhiqiu/5cd93e386237eadc203693d49bc21079
在这里插入图片描述
通过该工具可以涵盖多种硬件,尤其是国产芯片的快速部署。目前还没有尝试完成,打算尝试进行高通芯片的部署。有进展后更新。

总结

开篇,先搭一个文章框架,稍后随着学习的深入会跟大家分享一些踩坑经历,和学习总结。很高兴国产框架能做得这么好,也希望飞桨能推陈出新,更进一步!

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐