做网站需要执照吗怎么在四川建设厅网站上进行劳务合同备案

张小明 2025/12/31 4:43:52
做网站需要执照吗,怎么在四川建设厅网站上进行劳务合同备案,dedecms 网站还原,洛阳营销型网站建设摘要#xff1a;在 OCR#xff08;光学字符识别#xff09;领域#xff0c;国产开源项目 PaddleOCR 凭借其超轻量级、高精度和多语言支持#xff0c;已成为事实上的工业级标杆。本文将带你从零开始#xff0c;实战 PaddleOCR 的环境搭建、Python 代码调用、结果可视化以及…摘要在 OCR光学字符识别领域国产开源项目PaddleOCR凭借其超轻量级、高精度和多语言支持已成为事实上的工业级标杆。本文将带你从零开始实战 PaddleOCR 的环境搭建、Python 代码调用、结果可视化以及简单的服务部署。无论你是 AI 初学者还是寻找落地方案的工程师这篇文章都能帮你快速上手 PP-OCRv4 模型。1. PaddleOCR 简介为什么选择它PaddleOCR 是基于百度飞桨PaddlePaddle开发的 OCR 工具库。它的核心优势在于PP-OCR 系列模型提供超轻量模型适合移动端/嵌入式和通用模型适合服务器在速度和精度之间取得了极佳平衡。目前最新的PP-OCRv4效果显著。功能丰富支持文本检测、文本识别、关键信息提取KIE、表格识别等。多语言支持中、英、法、德、韩、日等 80 多种语言。2. 环境搭建 (Environment Setup)在开始之前请确保你的环境安装了 Python 3.8。2.1 安装 PaddlePaddle根据你的机器是否有 NVIDIA 显卡选择安装版本。CPU 版本通用适合快速测试Bashpython -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simpleGPU 版本推荐速度更快需安装 CUDABash# 具体的 CUDA 版本号请参考官网 python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple2.2 安装 PaddleOCR 及其依赖一行命令安装核心库Bashpip install paddleocr2.0.1同时为了后续可视化建议安装 OpenCV 和 MatplotlibBashpip install opencv-python matplotlib3. Python 核心实战文字识别接下来我们编写一个 Python 脚本使用 PP-OCRv4 模型识别一张包含中文的图片。3.1 准备一张测试图片假设你有一张名为test_img.jpg的图片可以是发票、路牌或文档截图。3.2 编写代码新建文件ocr_demo.pyPythonfrom paddleocr import PaddleOCR, draw_ocr import cv2 import matplotlib.pyplot as plt # 1. 初始化 OCR 模型 # use_angle_clsTrue: 自动加载方向分类器用于纠正翻转的文字 # langch: 设置语言为中文 print(正在加载模型...) ocr PaddleOCR(use_angle_clsTrue, langch) # 2. 图片路径 img_path ./test_img.jpg # 3. 执行预测 # result 是一个列表结构为 [ [ [box], (text, score) ], ... ] print(正在识别...) result ocr.ocr(img_path, clsTrue) # 4. 打印结果 print(---------------------------------------) for idx in range(len(result)): res result[idx] for line in res: print(f文本: {line[1][0]}, 置信度: {line[1][1]:.4f}) print(---------------------------------------) # 5. 结果可视化可选 from PIL import Image image Image.open(img_path).convert(RGB) boxes [line[0] for line in result[0]] txts [line[1][0] for line in result[0]] scores [line[1][1] for line in result[0]] # 使用 PaddleOCR 内置的绘图工具 im_show draw_ocr(image, boxes, txts, scores, font_path./fonts/simfang.ttf) # 注意需要指定一个支持中文的字体路径 im_show Image.fromarray(im_show) im_show.save(result.jpg) print(可视化结果已保存为 result.jpg)注意draw_ocr函数需要传入中文字体路径如simfang.ttf否则可视化图中的中文会显示为乱码。你可以在 Windows 的C:\Windows\Fonts下找到字体文件并复制到项目目录。3.3 运行效果运行脚本后终端会输出识别到的文字和置信度。4. 进阶实战参数调优与模型选择在实际生产中你可能需要调整参数以获得更好的效果。4.1 切换服务器模型高精度默认下载的是轻量级模型Mobile。如果你对精度要求极高且不在乎显存/耗时可以指定ocr_versionPython# 使用 PP-OCRv4 server 模型 ocr PaddleOCR(use_angle_clsTrue, langch, ocr_versionPP-OCRv4)4.2 调整检测阈值如果你发现有些模糊的字漏检了或者误检了噪点可以调整det_db_threshPython# 降低阈值可以检出更多模糊目标但可能增加误检 result ocr.ocr(img_path, clsTrue, det_db_thresh0.3)参数默认值说明det_db_thresh0.3二值化阈值越低召回率越高det_db_box_thresh0.6检测框阈值低于该值的框会被过滤use_gpuTrue是否使用 GPU 加速5. 极速部署PaddleHub Serving写好代码只是第一步如何将其变成一个 API 服务供前端调用我们可以使用PaddleHub快速部署。5.1 安装 PaddleHubBashpip install paddlehub5.2 启动服务只需一行命令即可启动一个 OCR 服务Bash# 启动中文 OCR 服务模块 hub serving start -m ch_pp-ocrv3 -p 88665.3 发送请求启动后可以通过 HTTP POST 请求调用Pythonimport requests import json import cv2 import base64 def cv2_to_base64(image): data cv2.imencode(.jpg, image)[1] return base64.b64encode(data.tostring()).decode(utf8) # 发送请求 headers {Content-type: application/json} url http://127.0.0.1:8866/predict/ch_pp-ocrv3 img cv2_to_base64(cv2.imread(test_img.jpg)) data {images: [img], text: true} r requests.post(urlurl, headersheaders, datajson.dumps(data)) print(r.json())6. 常见问题 (FAQ)Q: 报错OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.A: 在代码最开头加入Pythonimport os os.environ[KMP_DUPLICATE_LIB_OK]TRUEQ: 识别出的中文是乱码A: 请检查终端编码或者在可视化时确认font_path指向了正确的中文字体文件。Q: 第一次运行很慢A: 第一次运行PaddleOCR()时会自动下载模型权重文件约 15MB后续运行会直接加载本地缓存。7. 总结PaddleOCR 是目前 Github 上最活跃的 OCR 项目之一。通过本文我们完成了环境的快速搭建。使用 Python API 进行图片文字提取。结果的可视化绘制。基于 PaddleHub 的 API 服务部署。对于更复杂的场景如手写体识别、自定义数据集微调训练PaddleOCR 也提供了完善的文档支持。希望这篇实战指南能帮你打开 OCR 的大门如果你觉得文章有用欢迎点赞、收藏、关注开源地址PaddleOCR Github: https://github.com/PaddlePaddle/PaddleOCR
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

苏州 网站的公司做广告公司网站建设价格

第一章:Open-AutoGLM部署概述Open-AutoGLM 是一个面向自动化自然语言任务的开源大模型推理框架,支持多种后端加速引擎与分布式部署模式。该框架基于 GLM 架构设计,具备高效的上下文理解能力,适用于文本生成、智能问答和代码辅助等…

张小明 2025/12/29 8:39:05 网站建设

中小型企业网站建设与管理如何在服务器上放网站

Dify平台内置拼写检查:让AI更懂用户的真实意图 在构建AI应用的过程中,我们常常惊叹于大语言模型强大的生成能力——它可以写文章、做推理、甚至模拟人类对话。但现实却总在“打脸”:用户输入一句“我订但没收到货”,模型可能一脸茫…

张小明 2025/12/29 7:10:46 网站建设

网站开发人月薪对网站建设在电子商务中的看法

1. xv6 文件系统的整体结构:目录是一棵树xv6 的文件系统中:文件 字节数组(例如普通文件)目录 一种特殊的文件,里面存的不是内容,而是:文件名 → inode 号(指向文件的引用&#xff…

张小明 2025/12/29 8:39:13 网站建设

网站的经营方式织梦网站tag怎么做

Excalidraw:让CI/CD流水线“看得见”的协作革命 在一家快速扩张的科技公司里,新来的运维工程师第一次参加发布流程评审会。产品经理指着屏幕上一段YAML配置说:“这个after_script部分要加上安全扫描。”开发却皱眉回应:“但我们已…

张小明 2025/12/29 8:39:09 网站建设

可以免费建手机网站2023新闻摘抄十条

网络服务配置全解析:Samba与DNS实战指南 在网络管理的领域中,Samba服务和DNS(Domain Name System)服务是至关重要的组成部分。Samba服务允许Linux系统与Windows系统之间进行文件和打印机共享,而DNS服务则负责将人类可读的域名转换为计算机可识别的IP地址。下面将详细介绍…

张小明 2025/12/29 8:46:21 网站建设

app应用网站单页模板下载帮忙建站的公司

颠覆性演讲时间管理:5个隐藏技巧让计时器成为你的秘密武器 【免费下载链接】ppttimer 一个简易的 PPT 计时器 项目地址: https://gitcode.com/gh_mirrors/pp/ppttimer 你站在讲台上,心跳加速,手心冒汗。不是紧张于观众的目光&#xff…

张小明 2025/12/29 8:39:10 网站建设