.*?
里面的内容可能会被过滤掉 test = line.text() # 保留下划线及着重符标签 # 波浪线: # pq会将多个空格换成一个 if '.+?)', r"【1#\1##】", str(line)) line = re.sub(r'(.+?)', r"【2#\1##】", str(line)) line = re.sub(r'<(p style="text-(indent|align):.*?">.+?)# -*- coding: utf-8 -*- import re from pprint import pprint from pyquery import PyQuery as pq # # pattern = re.compile(r"\[来源.*?\]|www\..*?com") # # filter_words = ["学科网", "高考资源网", "Ziyuanku.com", "WWW.ziyuanku.com", # "高☆考♂资♀源€网", "w.w.w.k.s.5.u.c.o.m", "本资料由《七彩教育网》www.7caiedu.cn 提供!", # "本资料来源于《七彩教育网》http://www.7caiedu.cn", "本资料由《七彩教育网》www.7caiedu.cn 提", # "高考试题来源:"] # # # def filter_word(txt_list): # new_txt_list = [] # for word in txt_list: # if not word.strip(): # continue # new_word = re.sub(pattern, "", word) # for keys in filter_words: # if keys in new_word: # new_word = new_word.replace(keys, "") # new_txt_list.append(new_word) # return new_txt_list def filter_data(x): if not str(x).replace(" ", "").strip(): pass else: return str(x) def replace_k(con): # con = str(con).replace(" ", "+") # con = str(con).replace(" ", "+") con = re.sub(r'\s(?!(src="http|_src="http|class="tiankong"|data-num=))', "#+#", str(con)) return pq(con, parser="html") def css_label_wash(content): # todo add 9-4 """ 清洗文本中带有的css标签 :param content: :return: """ # temp_con = re.sub('?p(\s*|\s+style=.*?")?>', "", str(content)) if re.search('?(span|font|article|ul|ol|div)(\s*|\s+style=.*?")>|text\s*-\s*decoration: underline|border\s*-\s*bottom:', str(content)) is None: # content = re.sub('
', "\n", content).strip().replace("\n\n", "\n").replace("\n", "', "
", content) content = re.sub('
', "
\n", content) return content else: content = re.sub(r'', "", str(content)) content = re.sub(r'', "", str(content)) content = re.sub(r'', "", str(content)) content = re.sub(r'', "", str(content)) content = content.replace("", "").replace("", "") # content = content.replace("", "").replace("", "") content = content.replace('
', "\n").replace('
", content) # 2022/1/6 # content = re.sub('
', "", content)
# content = re.sub(' .*?
', "\n", content)
# parm = False
# if "
").replace("【+】", " "), line.text().split("\n"))) a.extend(new_line) elif str(line).startswith("
", "\n").replace("', "\n"). \ replace('
', "\n") b_list = b.split("\n") # b_list = list(filter(lambda x: str(x), b_list)) b_list = list(filter(filter_data, b_list)) b_list = list(map(lambda x: str(x), b_list)) a.extend(b_list) elif str(line).startswith("
" + new_a.replace("\n\n", "\n").replace("\n", "
\n") + "
" # for sb, img in subs2img.items(): # 2021 # new_a = new_a.replace(sb, img) # if parm: # new_a[0] = "\xa0" * 4 + new_a[0] new_a = re.sub(r"【(/?su[bp])】", r"<\1>", new_a).replace("【#lt;】", "<") return new_a if __name__ == '__main__': cons = r'''A.夏朝 | B.商朝 | C.周朝 | D.秦朝 |
1.下列对这首诗的赏析,不正确的一项是( )
小寒食舟中作
杜甫
佳辰强饮食犹寒,隐几萧条戴鹖冠。春水船如天上坐,老年花似雾中看。
娟娟戏蝶过闲幔,片片轻鸥下急湍。云白山青万余里,愁看直北是长安。
[注]这首诗写于大历五年春诗人淹留潭州时,即诗人去世前半年多。鹖(hé)冠:传为楚隐者鹖冠子所戴的帽子。
A.首联中“强饮”一词是痛快豪饮的意思,表明诗人晚年要纵酒人生。
B.颔联写诗人在船上所见所感,春来水涨,江流浩瀚,自己老眼昏花。
C.颈联运用叠词,具有韵律美,写景由近及远,由蝴蝶而鸥鸟,层次分明。
D.尾联总收全诗,诗人北望长安,思朝廷,忧愁顿生,有沉郁苍茫之美。
【答案】A
【解析】“强饮”理解有误。应是“勉强吃一点饭”的意思。故选A。
2.下列对这首诗的赏析,不正确的一项是( )
送客归江州
韩翃
东归复得采真①游,江水迎君日夜流。
客舍不离青雀舫,人家旧在白鸥洲②。
风吹山带遥知雨,露湿荷裳已报秋。
闻道泉明③居止近,篮舆相访为淹留。
【注】①采真:道教语,指顺乎天性,放任自然。②白鸥洲:指白鸥翔集的沙洲。此处借指客之家乡。③泉明:指晋陶渊明,此称其为泉明,乃避唐高祖李渊之讳。
A.这首诗写诗人送客人归江州隐居,但并无送别时的伤感,更多的是一种美好的祝福。
B.“江水迎君”采用拟人手法,客人归心似箭、归程片刻不能迟的心态跃然纸上。
C.“青雀舫”“白鸥洲”写出了诗人对客人旅舟华美,家乡景色宜人的赞美与羡慕。
D.尾联写诗人听说陶渊明居所离客人很近,定会借探访陶渊明居所之机去拜访客人。
【答案】D
【解析】D项,“定会借探访陶渊明居所之机去拜访客人”错误。尾联的意思是听说陶渊明居住的地方就在附近,你可以常常乘着竹轿,前往拜访。表达了诗人对客人隐逸情怀的赞美与羡慕。故选D。
3.对下面这首词的赏析,不恰当的一项是( )
渔家傲
范仲淹
塞下秋来风景异,衡阳雁去无留意。四面边声连角起,千嶂里,长烟落日孤城闭。
浊酒一杯家万里,燕然未勒归无计。羌管悠悠霜满地,人不寐,将军白发征夫泪。
A.这首词写出了我国北方秋季的景物特点,从词中的“塞下”“霜”等词语可以看出。
B.“衡阳雁去”是说“大雁向衡阳飞去”而不是“大雁从衡阳飞走了”。
C.这首词既表达了将士的爱国之心,又流露出思念亲人和家乡的感情。
D.这首词感情悲观而消极,表达了鲜明的反战、厌战情绪。
【答案】D
【解析】这首《渔家傲》为范仲淹创作,以描写北方秋季景物为背景,表达了作者对家国、亲人的思念以及将士们的英勇豪情。A项正确,词中的“塞下”“霜”等词语揭示了北方的秋季特点;B项正确,作者借衡阳雁南飞的景象暗示将士们向往家乡的渴望;C项正确,通过浓烈的爱国情感以及思念亲人的情绪表现,展现了作者的家国情怀和将士们的壮志豪情。不过,D项表述错误,词中并未明显表达反战、厌战情绪,其主要表达了将士们为国家和民族拼搏的精神。
4.对下面这首唐诗,赏析不恰当的一项是( )
早梅
万木冻欲折,孤根暖独回。前村深雪里,昨夜一枝开。
风递幽香出,禽窥素艳来。明年如应律,先发望春台。
A.首联把梅花与万木进行对比,万木的干枯摧折既有力地衬托了梅花的迎风斗雪,又好地照应了诗题中的“早”。
B.颔联用华丽的语言为读者描绘出了一幅浓艳、高贵的雪中梅花图。
C.颈联写梅花的风韵和姿色,尾联寄寓诗人深深的情思。
D.这首咏梅诗,语言清丽,笔墨含蓄,有着强烈的艺术感染力。
【答案】B
【解析】选项B不太恰当。颔联并没有用华丽的语言来描绘梅花,只是表达了梅花在寒雪中展现出的独立、高洁的风韵。这里并没有像选项B所说的“浓艳、高贵”。其余选项都能恰当地反映这首诗的特点和内容,因此答案选B。
5.对下面这首宋诗理解与赏析,不恰当的一项是( )
村行
王禹偁
马穿山径菊初黄,信马悠悠野兴长。
万壑有声含晚籁,数峰无语立斜阳。
棠梨叶落胭脂色,荞麦花开白雪香。
何事吟余忽惆怅?村桥原树似吾乡。
A.首联照应题目,点明地点和时令,写出了诗人信马徐行、观赏山野景色的悠然兴致。
B.第二联上下句构成对比,生动地表现出山中有时喧响有时静穆的景象。
C.第三联以“胭脂”和“白雪”为喻,形象地描绘出山村绚丽多彩的秋景。
D.最后两句设为问答,抒发了诗人由外界景物所触发的浓浓的思乡之情。
【答案】B
【解析】本题考查了对宋诗《村行》的理解与赏析。首先,A选项指出首联照应题目,点明了诗人信马行走在山间小路,看到菊花初黄,意境开阔。B选项提到第二联表现了山中有时喧响有时静穆的景象,但该联实际上并没有对比色彩,而是展示出千山万壑中奔涌着生机勃勃的晚响,无言的数峰沐浴在斜阳中。C选项正确地概括了第三联的内容,诗人通过赞美胭脂色的棠梨叶和白雪般芬芳的荞麦花存在世上,描绘出色彩斑斓的美景。D选项陈述了诗末以问答形式流露出的诗人对故乡情感的深刻思索。因此,答案为B选项,不恰当地解读了第二联。
6.下列对这首诗的赏析,不正确的一项是( )
酬元九侍御赠璧竹鞭长句①
刘禹锡
碧玉孤根生在林,美人相赠比双金。
初开郢客缄封后,想见巴山冰雪深。
多节本怀端直性,露青犹有岁寒心。
何时策马同归去,关树扶疏②敲镫吟。
[注]①此诗写于“永贞革新”失败后,作者被贬为朗州(今湖南)司马之时。元九,即诗人元稹,当时被贬为江陵(今湖北荆州)府士曹参军。②关树:关中之树。扶疏:枝叶繁茂。
A.首联运用比兴手法,以碧玉般竹鞭的名贵,暗示赠鞭者的高尚,赞扬之情跃然纸上
B.颔联写诗人看到朋友赠礼后内心非常欣喜,很想去观赏生长碧竹的巴山冰雪美景。
C.颈联通过“节”字,将“竹节”与“节操”相关联,把咏鞭与赞人联系在了一起。
D.尾联由竹鞭引发联想,表达了诗人愿与友人“策马同去”“敲镫吟诗”的美好愿望。
【答案】B
【解析】“很想去观赏生长碧竹的巴山冰雪美景”赏析有误。领联表达的意思是,我一打开郢客的缄封之后,立刻想到冰冻巴山雪深深。目睹竹鞭而展开联想,写出了制鞭之竹在“巴山冰雪”中傲然挺立的景象。这是对元稹不畏权势、宁折不弯的形象写照。是以竹喻人,表达对友人的赞美。译文:绿如碧玉的孤竹生在深林,用它制的璧竹鞭名贵万分;贤稳之人将竹鞭赠送给我,这份厚礼胜过了万两黄金。我一打开郢客的绒封之后,立刻想到冰冻巴山雪深深。鞭上多节,节节怀着端直性,遍体露青犹有岁寒后凋心。我们何时才能策马同归去,在扶疏的关树下敲镫高吟?
7.下列对这首诗的赏析,不正确的一项是( )
见别离者因赠之①
韩偓
征人草草尽戎装,征马萧萧立路傍。
尊酒阑珊将远别,秋山迤逦更斜阳。
白髭兄弟中年后,瘴海程途万里长。
曾向天涯怀此恨,见君呜咽更凄凉。
[注]①诗人生活在唐末战乱之际,当时自北而南,沿路所见,皆发于诗。
A.标题点明本诗写作的原由,“别离”一词陡生无限伤感情绪,奠定全诗情感基调。
B.首联紧扣“征人”与“征马”两个形象,真切地描绘了出征时的情景,画面感很强
C.颔联描写的是别后想象的虚景,诗人想象征人在离别亲人后沿着秋山远行的景象。
D.尾联直抒胸臆,眼前的别离勾起了诗人对自身的感叹,抒发了心中的无奈和感慨。
【答案】C
【解析】“颔联描写的是别后想象的虚景”说法错误,“尊酒阑珊将远别”是眼前实景。
8.下列对这首诗的赏析,不正确的一项是( )
大热五首(其一)
戴复古
天地一大窑,阳炭烹六月。
万物此陶镕,人何怨炎热。
君看百谷秋,亦自暑中结。
田水沸如汤,背汗湿如泼。
农夫方夏耘,安坐吾敢食!
【注】陶镕:陶铸熔炼,比喻培育、造就。
A.诗人把六月的天地比作一个大窑,太阳像炭火一样熔炼着其中的一切。
B.暑天虽极炎热,诗人却认为不应抱怨,因为秋天的谷物均赖此而结实。
C.田中的水被晒得似乎要沸腾,诗人的背上汗水流得就像刚刚用水泼过。
D.这首诗描写暑热多用比喻和夸张修辞,语言平易浅近,风格质朴自然。
【答案】C
【解析】“背汗湿如泼”描写的是农夫在暑热中辛苦劳作的情景,而不是指诗人自己。
''' # pprint(cons) # print(again_parse(cons)) # print(again_parse(cons)) # print(list(map(lambda x: str(x).replace(" ", " "), again_parse(cons)))) # con1 = r'解:A.研究跨栏动作时,刘翔的大小和形状不能忽略,不能看作质点,故A错误;
B.选取不同的参考系,物体的运动状态是不相同的,故B错误;
C.出租车收费是按路程收费的,故C错误;
D.第是指的时间,是指从末到末这一段时间,故D正确;
故选:D.