gojira.net
2022年01月14日 星期五 农历二〇二一年腊月十二日 [牛年] 阳历辛丑年辛丑月丁卯日 魔羯座
今天4~6度,小雨转阴。
今天折腾ocr识别,用pytesseract调用Tesseract-OCR,可就是一直报编码解析不了的错误,网上查不到这个问题。
其实我想到是这是误报,并没报出真实的错误,折腾了很久都没能解决。
后来打算放弃tesseract了,改用百度的ocr识别api,但之前都用得好好的接口竟然报错了:
{'error_code': 18, 'error_msg': 'Open api qps request limit reached'}
以为是超量了或者是到期了,又重新去申请了一个api,但仍然还是报这个错误,看到api官网网页里有个提示,可能要过半小时?但我不想等了。01ef4b47
后来突然想到之前tesseract报字符编码的错误,可能是找字典那里出了问题,原因是很久以前装的一个软件也用到了Tesseract-OCR,所以环境变量里也有相关信息,虽然Path和TESSDATA_PREFIX都已经是新信息了,但由于我不想重启电脑,导致还有一些连接关系还是之前那块软件的,而那款软件用到了中文路径,导致读字典的时候出错了。
基本就确定是这个原因了,重启一些应该能很快解决问题,但我还是不想重启电脑,毕竟开了这么多东西,重启一下也很费事。
所以直接去改python里面的包了,直接调用外部程序将识别出的文字放到一个文件内再读出来,虽然有点暴力,但问题总算解决了。
python报错真的是玄学,几次遇到莫名奇妙、毫不相干的错误提示信息,主要还是经验太少太菜了。
晚上烤火了,这火炉弄了后没烤几次,真是浪费,再不烤烤怕上面挂的腊肉都要坏掉了。
今天情绪不太好,又是些破人破事,搞得做事效率都低下。
2022年01月14日股票亏盈情况
股票名 | 股数 | 今涨幅% | 今盈亏额 | 总涨幅% | 总盈亏金额 |
---|---|---|---|---|---|
泰禾集团 | 26000 | -5.36% | -3637元 | -62.59% | -107432元 |
双鹭药业 | 22550 | 2.35% | 5856元 | -10.41% | -29631元 |
嘉诚国际 | 7000 | -2.04% | -4260元 | -23.73% | -63630元 |
罗牛山 | 16000 | 0.27% | 312元 | -9.40% | -12032元 |
三全食品 | 3000 | -5.02% | -3178元 | -31.70% | -27894元 |
江西铜业 | 6000 | -2.12% | -2933元 | -23.86% | -42414元 |
紫金矿业 | 12000 | -2.38% | -2873元 | -30.38% | -51408元 |
罗普特 | 4000 | -0.96% | -872元 | -46.37% | -77732元 |
诺泰生物 | 3000 | 6.58% | 7912元 | -45.24% | -105870元 |
园林股份 | 3000 | -2.26% | -1077元 | -13.82% | -7461元 |
清仓盈亏: | -177963.6元 | 今盈亏: | -4750元 | 总盈亏: | -703467.6元 |
上证指数:3521.26点,涨跌-34.00点,涨幅-0.96%
今日上涨股票 1547 支,涨停 84 支
今日下跌股票 3088 支,跌停 19 支
之前写一个py自动化的东西,主要是Python+Selenium+Chrome,也用了一下百度的OCR,不太行,主要是用来识别验证码,后利用了超级鹰的打码API,实现了一些功能。
用来爬数据?还是用来自动化提交数据?效率不太高,但在没办法的情况下只能用这个组合了。
百度效果还行,关键个人每天送不少,就是会隔段时间打个电话
是还可以,只可惜不知为啥被限制了,也不想去弄它了
哈哈,我一直用天若OCR识别
不是一个东西哦
10多年前,计算机系,一个同学拿着一张被水浸湿的纸,上面有散开的字,人眼完全无法辨认,说要拿去做OCR 识别,我直接跟他说,你转系吧,不适合学计算机。
哈哈哈,或许他需要的这功能几十年后的技术是能做到的。
你玩的东西都是高大上的