paddle ocr

环境配置:前置条件:本地需要有C++编译器,如果是windows可根据提示安装对应的visual studio编译器 我本机的配置如下,可以完美安装paddleocr:win10专业版64位,intel i7 + NVIDIA显卡 + visual studio 2015 安装方式(根据网速的不同,…

使用Python去除图片水印

思路很简单,就是先提取到水印的颜色取值范围,然后直接批量替换即可。 举例来说,下面的图片为需要处理的图片: 首先把其中的水印截取出来: 然后使用上文的代码(http://dylnn.wang/2021/12/%e4%bd%bf%e7%94%a8python%e6%9f%a5%e6%89%be%e5%…

使用Python查找图片的主色

本样例中输出的内容为: [(255, 255, 255), (254, 254, 254), (253, 253, 253), (228, 228, 228), (245, 245, 245), (231, 231, 231), (234, 234, 234), (250, 250, 250), (…

Python文字识别(OCR)-基于Tesseract

基于tesseract可以做文字识别,具体案例如下 前期准备 1.安装好python 2.安装PIL库和pytesseract库 3.本地下载了tesseract程序 - 本例以windows为例 下载及安装tesseract 上传了一个纯净离线包,可以直接解压使用,如有需要,可以自行搜索网上比较新…

Python拾遗

目录 打开文件-读json 遍历文件目录 打开文件-读json 遍历文件目录 遍历文件目录 - 过滤某文件名

ubuntu 16.04安装selenium

环境:ubuntu版本号:16.04 Python版本号:3.7 安装步骤: 1、安装selenium; 备注:pip如果存在多个版本,需要标明版本号,例:pip3.7 2、查看selenium版本号: 3、测试: 注意事项:1.第一次测试时出现如下错误提示:selenium.common.exce…

《数据挖掘原理与实践》

《数据挖掘原理与实践》 第二章 数据处理机基础 根据属性具有的不同性质,属性可分为4种:标称(Nominal)、序数(Ordinal)、 区间(Interval)和比率(Ratio)。 ① 标称(Nominal)属性:其属性值只提供足够的信息以区分对象,如颜色、性别、产品编号等;这种属性值没有实际意…