暂无描述

莺声燕语 b68e8ba10b 入库增加subject_id参数 1 年之前
.idea b68e8ba10b 入库增加subject_id参数 1 年之前
__pycache__ 0037bb47d9 测试后第一版 2 年之前
data 0037bb47d9 测试后第一版 2 年之前
logs 0037bb47d9 测试后第一版 2 年之前
res_folder 0037bb47d9 测试后第一版 2 年之前
structure 47af7b2e15 支持中职解析,更新入库参数 1 年之前
templates 50e1b2af55 word结构化 3 年之前
utils b68e8ba10b 入库增加subject_id参数 1 年之前
README.md 50e1b2af55 word结构化 3 年之前
ans_structrue_old.py 0037bb47d9 测试后第一版 2 年之前
app_test.py 3229912c07 入库流程规范 2 年之前
ceshi.py c76929b6b3 保存入库回调带上请求头 2 年之前
configs.py 5da002eeb4 将题型限制相关改为99题 1 年之前
requirements.txt 50e1b2af55 word结构化 3 年之前
ruku_test.py c74266a862 难度初始默认值修改 2 年之前
server.py 47af7b2e15 支持中职解析,更新入库参数 1 年之前
server3.py 0037bb47d9 测试后第一版 2 年之前
svg_data1.pickle fede83e2b6 all_mathjax的获取修改 2 年之前
test.py 47af7b2e15 支持中职解析,更新入库参数 1 年之前

README.md

1.任务说明

​ 对word格式(doc, docx)的高中数学试卷进行解析结构化

主要支持3大类型:1>>模板格式的教师类用卷(每道题目下面含答案和解析)

​ 2>> 题文和答案分开的形式,即题文单独放一起,答案单独放一起

​ 3>> 只含题文,或题文下只含答案或解析

要求

​ 1>>排版规范,每道题或其答案从前往后,从小到大排列,题号连续不重复;

​ 2>>与题文无关内容删除,特别是试卷中间和结尾的无用信息;

​ 3>>题型行尽量明确;

​ 4>>题文和答案分开的形式中,答案的标题要明显有“参考答案”类似字样,后面无用部分删除;

​ 5>>本文所述试卷仅包含题型行、题干、答案、解析、分析、点睛、点评等,像每个题后面插个变式训练类型的非正式试卷不支持!

结构化返回形式

{ "errcode": 0, "errmsg": "OK", "items": [{ "options": [ "", "", "", "" ], "option_rank": xx, "type": xx, "stem": xx, "analysis": xx, "key":xx, "score": xx, "is_optional": false, "is_multiple_choice": false },{},],"option_str": "不是选做题|4选2|2选1", "multiple_choice": "没有多选题|多选题" } 

解析流程

image-20200805185530356

解析报错类型

​ 第一种:大错误,需要按提示重新上传

​ 1>>wordbin解析失败;

​ 2>>题号出现无法自动纠正错误;

​ 3>>题文和答案数目不一致;

​ 第二种:小错误,按小题报错信息进行修改

​ 1>>选择题选项格式不对;

​ 2>>答案或解析缺失;

​ 第三种:显示问题,自行修改

2.环境配置

  • 操作系统:Windows
  • 编程语言:python
  • 开发工具: pycharm
  • 代码托管平台: http://gitz.zhixinhuixue.net:18880/

  • 上线服务器: 182 和 185

  • 所需配套环境或服务:office word 、wordbin 、mathtype6