<button id="2ddn7"><acronym id="2ddn7"></acronym></button>

<button id="2ddn7"><acronym id="2ddn7"></acronym></button>

  • <button id="2ddn7"><object id="2ddn7"></object></button>
      1. <s id="2ddn7"></s>
        更多課程 選擇中心


        Python培訓

        400-111-8989

        用Python語言爬蟲抓取微博評論圖文教程

        • 發布: 羅羅攀
        • 來源:Python中文社區
        • 時間:2017-08-29 16:11

        提交Cookie信息模擬微博登錄

        需要爬取登錄之后的信息,大家都是望而止步,不要擔心,今天呢,給大家提供一個超級簡單的方法,就是提交Cookie信息登錄微博,首先,我們找到某明星的微博網址:http://m.weibo.cn/u/1732927460 這里是登錄的移動端,你會發現,你點擊網址會自動跳轉到登錄微博的界面(沒有跳轉的注銷掉自己的賬號),如下圖所示:

        然后登錄自己的賬號密碼,這時記得打開Fiddler進行抓包,如圖所示,提取Cookie做為請求某明星微博網址的請求頭即可。

        異步加載數據如何爬取

        我在網上看過移動端的微博數據很好爬,沒有異步加載,可是不知道為什么,我的評論數據就是異步加載的,其實異步加載不可怕,找到相應js包即可,如下圖為某明星的一條微博和評論的js包。我們只需請求這個js數據,然后利用json庫即可提取我們所需的評論數據。

        代碼

        爬取的數據導入數據庫后又導出為csv格式進行分析

        詞云制作及分析

        可以說支持的評論更多一些:例如愛你,喜歡,堅強等等;不過也有不少的惡意評論:黑,惡心,討厭等。

        總結

        1、Cookie提交是一個簡單不錯的選擇,但Cookie信息隱藏著隱私,大家千萬別暴露在外面,以防外人所利用。

        2、異步加載不可怕,找包有技巧,有id,vid等字段的嫌疑最大,多練習就行。

        預約申請免費試聽課

        填寫下面表單即可預約申請免費試聽!怕錢不夠?可就業掙錢后再付學費! 怕學不會?助教全程陪讀,隨時解惑!擔心就業?一地學習,可全國推薦就業!

        上一篇:學習 Python 的三種境界
        下一篇:會幫助到99% Python 學習者的簡明語法總結

        2021年Python面試題及答案匯總詳解

        python數據分析,你需要這些工具

        Python培訓講解二叉樹的三種深度

        Python培訓:如何實現窮舉搜索?

        • 掃碼領取資料

          回復關鍵字:視頻資料

          免費領取 達內課程視頻學習資料

        • 視頻學習QQ群

          添加QQ群:1143617948

          免費領取達內課程視頻學習資料

        Copyright ? 2021 Tedu.cn All Rights Reserved 京ICP備08000853號-56 京公網安備 11010802029508號 達內時代科技集團有限公司 版權所有

        選擇城市和中心
        黑龍江省

        吉林省

        河北省

        湖南省

        貴州省

        云南省

        廣西省

        海南省

        青青青草网站免费观看|青青青视频在线观看 超真实强奷视频在线看 百度 好搜 搜狗
        <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>