" not in str(content): # parm = True subs2img = {} if re.search('" in content: all_imgs = re.findall('|.*?', content, flags=re.S) for k, img in enumerate(all_imgs): content = content.replace(img, "&{}&".format(k)) subs2img["&{}&".format(k)] = img content = re.sub(r"<(su[bp])>(.*?)", r"【\1】\2【/\3】", content) html = pq(content, parser="html") a = [] if html.children(): for line in html.children().items(): #

.*?

里面的内容可能会被过滤掉 test = line.text() if str(line).startswith("", "\n").replace("
", "\n").replace("
", "\n") + "\n") a.append(line.html()) else: line = replace_k(line) if "
" in str(line) or "
" in str(line) or "
" in str(line): line = str(line).replace("
", "###").replace("
", "###").replace("
", "###") line = pq(line) new_line = list(map(lambda x: str(x).replace("#+#", " "), line.text().split("###"))) a.extend(new_line) else: if line.text().strip(): a.append(line.text().replace("#+#", " ")) elif "

" in str(line) and "

" in str(line): line = re.sub(r'', "", str(line.html())) b = line.replace('

', ""). \ replace("
", "\n"). \ replace("
", "\n"). \ replace("
", "\n"). \ replace('

', "\n"). \ replace('

', "\n") b_list = b.split("\n") # b_list = list(filter(lambda x: str(x), b_list)) b_list = list(filter(filter_data, b_list)) b_list = list(map(lambda x: str(x), b_list)) a.extend(b_list) elif str(line).startswith(" ；&变为&； a.append(content.strip()) new_a = "\n".join(list(filter(lambda x: x.strip(), a))) if subs2img: new_a = re.sub("|".join(subs2img.keys()), lambda x: subs2img[x.group()], new_a) new_a = "

" + new_a.replace("\n\n", "\n").replace("\n", "

") + "

" # for sb, img in subs2img.items(): # 2021 # new_a = new_a.replace(sb, img) # if parm: # new_a[0] = "\xa0" * 4 + new_a[0] new_a = re.sub(r"【(/?su[bp])】", r"<\1>", new_a) return new_a if __name__ == '__main__': cons = r'''

Nancycarrots are good for eyes.Eat some,please.

【答案】
【解析】

''' # cons = '''

Unbelievable！Oh..., _____ you don't mind, I'll stop and take a deep breath.

【答案】

1.if。考查if引导的条件状语从句。根据句意可知。

【解析】

''' # pprint(cons) # print(again_parse(cons)) # print(again_parse(cons)) # print(list(map(lambda x: str(x).replace(" ", " "), again_parse(cons)))) # con1 = r'

解：A．研究跨栏动作时，刘翔的大小和形状不能忽略，不能看作质点，故A错误；
B．选取不同的参考系，物体的运动状态是不相同的，故B错误；
C．出租车收费是按路程收费的，故C错误；
D．第 ${4 \rm{s} }$ 是指 ${1 \rm{s} }$ 的时间，是指从 ${3 \rm{s} }$ 末到 ${4 \rm{s} }$ 末这一段时间，故D正确；
故选：D．

' cons = css_label_wash(cons) print(cons)