Readme.md 552 B

英语word格式试卷内容获取

该程序主要是为了获取word格式内容,由word生成html文件,并清洗html返回文本。

Requirements

  • python3.6
  • office2010+
  • word_bin
  • mathtype
  • bottle
  • requests
  • beautifulsoup4

Project Structure

OCR
|   server.py	#服务启动程序
|   filepath2text #route_filename函数为获取word内容的入口,转为html文件,清洗html格式,

Run

线上服务
python server.py