快速实现《活着》评论词云

2019年1月4日 15:02

                           

1.利用requests 爬取关于《活着》这本书所有的评论

import requests
import sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding( "utf-8" )
page = 1
while True:
    url = 'http://www.ireader.com/index.php?ca=Sns_Topic.Index&pca=bookdetail.index&cid=book_11040512&page={curr_page}'.format(curr_page=str(page))

    ret = requests.get(url=url)

    soup = BeautifulSoup(ret.text)

    res = soup.find_all(attrs={"class":"disTxt"})
    for li_item in res:
        text = (li_item.a.string)
        with open('ret.text', 'a') as file_obj: file_obj.write(str(text))

    next_page = soup.find_all(attrs={"class":"down"})
    for page_item in next_page:
        print(page_item.get('href'))
        page = str(page_item.get('href'))
        page = page.rsplit('=',1)[1]
        print(page)
    
    if not page:
        break
2.通过jieba 进行分词
import jieba
import sys
import json
reload(sys)
sys.setdefaultencoding( "utf-8" )

words_dict = {}
new_dict = {}
with open('ret.text', 'r') as fiel_obj:
    while True:
        content = fiel_obj.readline()
        if content:
            #print(content)
            seg_list = jieba.cut(content.strip(), cut_all=False)
            for word in seg_list:
                if word not in ['', ' ']:
                    #print(word)
                    if str(word) not in words_dict.keys():
                        words_dict[str(word)] = 1
                    else:
                        words_dict[str(word)] += 1
        else:
            break
with open('words_dict.json', 'w') as file_obj: file_obj.write(json.dumps(words_dict,ensure_ascii=False))
3.分词统计后,利用小工具进行词云的生成。这里使用在线生成工具

小工具链接:https://wordart.com/create

4.10条热评

(1)生活如此艰难,然而还要活着,因为活着不为任何人任何事,只为活着本身而活,想象着富贵和他唯一的牛在田里耕地的背影,鼻子就一阵发酸,富贵这一生阿就只剩“富贵”——他的牛了,他说难过却也踏实,他什么都不剩了,也不再害怕失去了,他们一家人也终将会团聚。愿看完这本书的你我都坚强的活下去。


(2)那一代的年轻人,估计是最可悲的吧,最好的年纪,却精神贫瘠,被集体洗脑,做些毫无意义的,暴戾罪恶的事


(3)小时候,爸妈几乎每天五点多起来,煮好了饭菜叫我们起来,干活。03年在村里上了小学,哥哥姐姐也都在上学,义务教育还没普及,06年取消了农业税,收入靠卖粮食卖橡胶片。家里的三四亩地不够种,向那些种少的借来种,回以报酬,通常都是给米。犁田就辛苦了家里的那头黑牛,我还从它背上摔下来过。记得家里最穷的时候连十几块钱的电费都交不上,那时我还在上小学。算是幸运的,以往都收橡胶片,那时就有人收了胶水,电费交上了。爸妈辛苦了半辈子......


(4)知道自已为什么而活,就可以忍受任何一种生活。富贵对至亲不仅仅有满满的爱还有责任。当所有至亲离去时,他已经看淡生死了。死是一种解脱,难的是活着和选择。


(5)二喜随时想的都是苦根,才会在那一瞬间爆喊出苦根的名字。他的内心可能又是解脱,又是绝望。


(6)以前,我经常觉得父母没有梦想和信仰,只是为了活着而做活。最近,我才发现梦想信仰是一种昂贵的东西,一个都无法活好的人,要不起。而我,其实也不过是有人为了我现在的安逸负重前行。


(7)读罢此书后还是觉得作者余华太残忍!无法相信生活中会有这么悲惨的事情,因此比较难融入到故事里。福贵的幸与不幸我没有发言权,年轻时过着锦衣玉食的生活,却是败家子一个,年老时早已痛改前非,努力生活,却只有一头老牛相伴。这一生有过荣华也经历了贫穷,痛苦常常相伴,欢乐也时时有。也许生活不曾对他温柔以待,其实很多人又何尝不是这样呢?但这又有什么关系,能改变的我们努力过了,不能改变的也不怨天尤人。当生活狠狠赏我们一个耳光后,愿我们都能像福贵一样,外壳越来越坚硬,内心越来越柔软。苦涩里都是有甜头的,所谓的考验也许是上天对你独特的恩宠。就像福贵一样或许失去了很多,但他的生命其实越来越丰盈,不是么?这样一个有故事的老人无形中给了我们读者多少力量啊!


(8)难道非要用生命用所有的家业才能换回一个人的如梦初醒吗?如果可以,我愿意用我的生命来换回我哥的良知和醒悟.


(9)“凤霞,你可不要忘记我是你爹。” 凤霞听了这话咯咯笑起来,她说: “你也不要忘记我是凤霞。”


(10)一本书,一个故事,一段历史,我花了12个小时的时间旁观完了富贵的大半生虽然在刚开始看时,我就猜到跌跌撞撞地活到最后还是只剩了一人一牛,但是我不去想,刻意避开这结局,所以在看书的过程中,我始终不敢太为某些情节而开心,比如二喜的出现,比如苦根的出生,这些都是富贵生活里突然出现的惊喜和希望,是光,我又为每个人的离去感到害怕,无措,仿佛最后会是我和富贵一起承担这命运就像他们说的,《活着》这本书的阅读是残忍的,余华不遗余力展示误导的命运如何摧毁人的生活。《活着》里面不管是谁,都有着自己的人格魅力,都有着热爱生活,吃苦耐劳,不为苦难所打倒的人格精神,无论是家珍,凤霞,有庆,二喜,苦根还是队长,春生,都有着强烈的人格魅力,这些都应该好好活着的人却被命运捉弄,抛弃,读者怎么会不心痛呢,这就是残忍的原因所在吧!


评论

暂时还没有评论,欢迎评论!