-->

回首頁 會員中心 我的購物車 線上留言 付款說明 常見問題 加入最愛 退出登入   

首次訂購請先參閱訂購說明〕 非會員可直接訂購

購物車   線上留言     免費課程  


課程(名稱.編號)簡索

 

  帳  號:  

  密  碼:  

 
    
            關於我們
            課程說明
            訂購說明
            付款說明

       領導藝術.綜合管理
       人力資源.企業培訓
       職務能力培訓系統班
       銷售實戰.市場行銷
       職場技能.個人成長
       Office白領辦公達人
       財經金融.投資理財
       語言學習.出國留學
       中國大陸證照培訓
       資格考試.考証培訓
       文化.生活.興趣.保健
       生產管理.採購物流
       移動開發
       前端開發
       後端開發
       數據庫.服務器
       網頁平面設計
       雲計算.大數據
       網絡營銷推廣
       自然學科
       工程技術學科
       經濟管理學科
       醫.藥.農.林學科
       法律 學科
       計算機工程學科
       哲學.歷史學科
       文學.藝術學科
       教育社會學科
       外語 學科
       醫藥農林
       哲學歷史
       文學藝術
       工程技術
       基礎科學
       經管法學

目前位置:首頁 > 【大學教育課程】 > 計算機工程學科 > 程序語言|數據庫|軟件


課程名稱:     Python網絡爬蟲與信息提取
課程編號: MS_5008 系列: (大學)國家級課程
授課學校: 北京理工大學

授時:

全 62 講

授課語言: 中文

光碟版:

 1   片教程光碟(mp4檔)

其他說明: ..........
簡      介: 互聯網是功能集合,更是存儲空間;海量數據孕育巨大價值,數據採集需求迫切。網絡爬蟲已經成為自動獲取互聯網數據的主要方式,數據就在那裡,它是你的嗎?請跟隨我們,5周..........
光碟版: NT$ 598 購 買:
訂購說明: ◎優惠期間中!各版本為均一價,請於結帳時註明
◎網路版→檔案複查中,暫不提供
◎光碟版→各國(地區)暫不提供光碟配送服務
下載版→由Google 雲端硬碟下載,(請備記 Gmail帳號)
      訂購多套另附--贈送課程
              喜歡這門課程嗎?按分享推薦給你的朋友吧!

      

   

    互聯網是功能集合,更是存儲空間;海量數據孕育巨大價值,數據採集需求迫切。網絡爬蟲已經成為自動獲取互聯網數據的主要方式,數據就在那裡,它是你的嗎?請跟隨我們,5周時間,掌握利用Python爬取網絡數據並提取信息的"小"本領。還等什麼?快寫個爬蟲探索世界吧!

  ——   課程團隊
課程概述

快訊:本課程是國家精品課程「Python網絡爬蟲與數據分析」的上半部分,當前為第6次開課,歡迎大家前來學習!

—— 為什麼要學習網絡爬蟲?
—— 因為數據都在網上,先要爬下來才能挖掘淘金 ...


「The website is the API.」 (網頁即接口)網絡爬蟲是獲取數據的必備本領,不要猶豫!



本課程面向具有Python編程基礎的各類學習者,講解利用Python語言爬取網絡數據並提取關鍵信息的技術和方法,幫助學習者掌握定向網絡數據爬取和網頁解析的基本能力。

本課程介紹Python計算生態中最優秀的網絡數據爬取和解析技術,具體講授構建網絡爬蟲功能的兩條重要技術路線:requests-bs4-re和Scrapy,所講述內容廣泛應用於Amazon、Google、PayPal、Twitter等國際知名公司。課程內容是進入大數據處理、數據挖掘、以數據為中心人工智能領域的必備實踐基礎。

本課程教學內容包括:


· Python第三方庫Requests,講解通過HTTP/HTTPS協議自動從互聯網獲取數據並向其提交請求的方法;
· Python第三方庫Beautiful Soup,講解從所爬取HTML頁面中解析完整Web信息的方法;
· Python標準庫Re,講解從所爬取HTML頁面中提取關鍵信息的方法;
· Python第三方庫Scrapy,介紹通過網絡爬蟲框架構造專業網絡爬蟲的基本方法。

本課程希望傳遞「理解和運用計算生態」的理念,重點培養學習者運用當代最優秀第三方專業資源,快速分析和解決問題的能力。"人生苦短,不要刀耕火種「,嵩老師教你直面問題和需求,用最好的工具解決它!

本課程是國家精品在線開放課程「Python網絡爬蟲與數據分析」課程的上半部分。「Python網絡爬蟲與數據分析」課程由「Python網絡爬蟲與信息提取」和「Python數據分析與展示」兩門MOOC課程組成,完整地講解了數據獲取、清洗、統計、分析、可視化等數據處理週期的主要技術內容,培養計算思維、數據思維及採用程序設計方法解決計算問題的實戰能力技術。



課程大綱

【第 o周】網絡爬蟲之前奏

課時
「網絡爬蟲」課程內容導學
Python語言開發工具選擇

【第一周】網絡爬蟲之規則

課時
本周課程導學
單元1:Requests庫入門
單元2:網絡爬蟲的「盜亦有道」
單元3:Requests庫網絡爬蟲實戰(5個實例)

【第二周】網絡爬蟲之提取

課時
本周課程導學
單元4:Beautiful Soup庫入門
單元5:信息組織與提取方法
單元6:實例1:中國大學排名爬蟲

【第三周】網絡爬蟲之實戰

課時
本周課程導學
單元7:Re(正則表達式)庫入門
單元8:實例2:淘寶商品比價定向爬蟲
單元9:實例3:股票數據定向爬蟲

【第四周】網絡爬蟲之框架

課時
本周課程導學
單元10:Scrapy爬蟲框架
單元11:Scrapy爬蟲基本使用
單元12:實例4:股票數據Scrapy爬蟲




課程列表

第01講 1.1.1網絡爬蟲課程內容導學 - 全課程內容導學 → 00:03:38
第02講 1.2.1Python語言開發工具選擇 - Python語言開發工具選擇 → 00:07:14
第03講 2.1.1本周課程導學 - 第一周內容導學 → 00:01:42
第04講 2.2.1單元1Requests庫入門 - Requests庫的安裝 → 00:02:09
第05講 2.2.2單元1Requests庫入門 - Requests庫的get()方法 → 00:09:27
第06講 2.2.3單元1Requests庫入門 - 爬取網頁的通用代碼框架 → 00:05:35
第07講 2.2.4單元1Requests庫入門 - HTTP協議及Requests庫方法 → 00:09:37
第08講 2.2.5單元1Requests庫入門 - Requests庫主要方法解析 → 00:12:37
第09講 2.2.6單元1Requests庫入門 - 單元小結 → 00:02:18
第10講 2.3.1單元2網絡爬蟲的盜亦有道 - 網絡爬蟲引發的問題 → 00:08:11

第11講 2.3.2單元2網絡爬蟲的盜亦有道 - Robots協議 → 00:05:36
第12講 2.3.3單元2網絡爬蟲的盜亦有道 - Robots協議的遵守方式 → 00:02:33
第13講 2.3.4單元2網絡爬蟲的盜亦有道 - 單元小結 → 00:01:12
第14講 2.4.1單元3Requests庫網絡爬蟲實戰5個實例 - 實例1京東商品頁面的爬取 → 00:02:31
第15講 2.4.2單元3Requests庫網絡爬蟲實戰5個實例 - 實例2亞馬遜商品頁面的爬取 → 00:07:02
第16講 2.4.3單元3Requests庫網絡爬蟲實戰5個實例 - 實例3百度360搜索關鍵詞提交 → 00:04:43
第17講 2.4.4單元3Requests庫網絡爬蟲實戰5個實例 - 實例4網絡圖片的爬取和存儲 → 00:06:12
第18講 2.4.5單元3Requests庫網絡爬蟲實戰5個實例 - 實例5IP地址歸屬地的自動查詢 → 00:04:50
第19講 2.4.6單元3Requests庫網絡爬蟲實戰5個實例 - 單元小結 → 00:02:29
第20講 3.1.1本周課程導學 - 第二周內容導學 → 00:01:07

第21講 3.2.1單元4BeautifulSoup庫入門 - BeautifulSoup庫的安裝 → 00:06:38
第22講 3.2.2單元4BeautifulSoup庫入門 - BeautifulSoup庫的基本元素 → 00:18:55
第23講 3.2.3單元4BeautifulSoup庫入門 - 基於bs4庫的HTML內容遍歷方法 → 00:12:27
第24講 3.2.4單元4BeautifulSoup庫入門 - 基於bs4庫的HTML格式化和編碼 → 00:03:36
第25講 3.2.5單元4BeautifulSoup庫入門 - 單元小結 → 00:02:38
第26講 3.3.1單元5信息組織與提取方法 - 信息標記的三種形式 → 00:10:02
第27講 3.3.2單元5信息組織與提取方法 - 三種信息標記形式的比較 → 00:05:11
第28講 3.3.3單元5信息組織與提取方法 - 信息提取的一般方法 → 00:04:39
第29講 3.3.4單元5信息組織與提取方法 - 基於bs4庫的HTML內容查找方法 → 00:11:22
第30講 3.3.5單元5信息組織與提取方法 - 單元小結 → 00:01:52

第31講 3.4.1單元6實例1中國大學排名爬蟲 - 中國大學排名定向爬蟲實例介紹 → 00:06:45
第32講 3.4.2單元6實例1中國大學排名爬蟲 - 中國大學排名定向爬蟲實例編寫 → 00:13:21
第33講 3.4.3單元6實例1中國大學排名爬蟲 - 中國大學排名定向爬蟲實例優化 → 00:05:05
第34講 3.4.4單元6實例1中國大學排名爬蟲 - 單元小結 → 00:00:52
第35講 4.1.1本周課程導學 - 第三周內容導學 → 00:01:29
第36講 4.2.1單元7Re(正則表達式)庫入門 - 正則表達式的概念 → 00:06:06
第37講 4.2.2單元7Re(正則表達式)庫入門 - 正則表達式的語法 → 00:12:05
第38講 4.2.3單元7Re(正則表達式)庫入門 - Re庫的基本使用 → 00:21:31
第39講 4.2.4單元7Re(正則表達式)庫入門 - Re庫的match對像 → 00:04:54
第40講 4.2.5單元7Re(正則表達式)庫入門 - Re庫的貪婪匹配和最小匹配 → 00:03:13

第41講 4.2.6單元7Re(正則表達式)庫入門 - 單元小結 → 00:01:42
第42講 4.3.1單元8實例2淘寶商品比價定向爬蟲 - 淘寶商品信息定向爬蟲實例介紹 → 00:05:43
第43講 4.3.2單元8實例2淘寶商品比價定向爬蟲 - 淘寶商品信息定向爬蟲實例編寫 → 00:16:10
第44講 4.3.3單元8實例2淘寶商品比價定向爬蟲 - 單元小結 → 00:01:01
第45講 4.4.1單元9實例3股票數據定向爬蟲 - 股票數據定向爬蟲實例介紹 → 00:08:09
第46講 4.4.2單元9實例3股票數據定向爬蟲 - 股票數據定向爬蟲實例編寫 → 00:15:37
第47講 4.4.3單元9實例3股票數據定向爬蟲 - 股票數據定向爬蟲實例優化 → 00:06:45
第48講 4.4.4單元9實例3股票數據定向爬蟲 - 單元小結 → 00:02:13
第49講 5.1.1本周課程導學 - 第四周內容導學 → 00:00:57
第50講 5.2.1單元10Scrapy爬蟲框架 - Scrapy爬蟲框架介紹 → 00:08:45

第51講 5.2.2單元10Scrapy爬蟲框架 - Scrapy爬蟲框架解析 → 00:07:14
第52講 5.2.3單元10Scrapy爬蟲框架 - requests庫和Scarpy爬蟲的比較 → 00:04:46
第53講 5.2.4單元10Scrapy爬蟲框架 - Scrapy爬蟲的常用命令 → 00:03:41
第54講 5.2.5單元10Scrapy爬蟲框架 - 單元小結 → 00:01:09
第55講 5.3.1單元11Scrapy爬蟲基本使用 - Scrapy爬蟲的第一個實例 → 00:12:29
第56講 5.3.2單元11Scrapy爬蟲基本使用 - yield關鍵字的使用 → 00:07:34
第57講 5.3.3單元11Scrapy爬蟲基本使用 - Scrapy爬蟲的基本使用 → 00:07:56
第58講 5.3.4單元11Scrapy爬蟲基本使用 - 單元小結 → 00:00:59
第59講 5.4.1單元12實例4股票數據Scrapy爬蟲 - 股票數據Scrapy爬蟲實例介紹 → 00:01:24
第60講 5.4.2單元12實例4股票數據Scrapy爬蟲 - 股票數據Scrapy爬蟲實例編寫 → 00:15:24
第61講 5.4.3單元12實例4股票數據Scrapy爬蟲 - 股票數據定向Scrapy爬蟲實例優化 → 00:02:26
第62講 5.4.4單元12實例4股票數據Scrapy爬蟲 - 單元小結 → 00:01:09

 

 

課程編號 課 程 名 稱 集 數(全) 主講人(單位) 課程系列
  GS_6558  編譯原理  全 50  集  國防科學技術大學 本科國家級課程 
  GS_3979  電腦控制系統  全 24  集  長春工業大學 本科國家級課程 
  SR_7177  彙編語言程序設計  全 51  集  中山大學 遠距教育課程 
  SR_2611  彙編語言  全 34  集  遼寧石油化工大學 國家級課程 
  SR_7178  彙編語言  全 51  集  石油大學 遠距教育課程 
  SR_7168  軟體工程與軟體測試優化技術  全 40  集  上海交通大學 遠距教育課程 
  SR_7167  軟件工程  全 51  集  吉林大學 遠距教育課程 
  SR_7166  統一軟件開發過程  全 30  集  電子科技大學 遠距教育課程 
  MS_5196  現代科學運算—MATLAB語言與應用  全 102  集  東北大學) 國家級課程 
  MS_3342  深度強化學習導論  全 25  集  復旦大學 本科國家級課程 
  MS_3341  推薦系統  全 26  集  北京大學 本科國家級課程 
  SR_7104  面向對象 C++ 語言  全 38  集  電子科技大學 遠距教育課程 
  MS_2016  計算機輔助翻譯原理與實踐  全 197  集  北京大學 國家級課程 
  MS_5537  計算機程序設計(C++)  全 160  集  西安交通大學 本科國家級課程 
  SR_7169  計算機軟件技術基礎  全 44  集  電子科技大學 遠距教育課程 
  MS_3364  信息隱藏技術  全 58  集  南開大學 本科國家級課程 
  SR_7155  物件導向 C++ 程式設計  全 40  集  電子科技大學 遠距教育課程 
  GS_6803  用戶體驗與產品創新設計  全 130  集  浙江大學 本科國家級課程 
  SR_7121  Visual C++ 6.0 語言程式設計  全 56  集  哈爾濱工業大學 遠距教育課程 
  SR_7119  Visual Basic 編程與應用  全 64  集  吉林大學 遠距教育課程 
  SR_7123  Visual Basic 6.0程序設計基礎  全 36  集  上海交通大學 遠距教育課程 
  SR_7118  VB程序設計  全 40  集  電子科技大學 遠距教育課程 
  SR_7160  VB 高級語言程序設計  全 52  集  哈爾濱工業大學 遠距教育課程 
  SR_7117  TCP / IP協議原理  全 42  集  電子科技大學 遠距教育課程 
  MS_3339  SPSS數據分析與量化研究  全 65  集  北京師範大學 本科國家級課程 
  MS_5240  Python語言程序設計  全 258  集  北京理工大學 國家級課程 
  MS_5008  Python網絡爬蟲與信息提取  全 62  集  北京理工大學 國家級課程 
  SR_7220  Power Builder程序設計  全 24  集  哈爾濱工業大學 遠距教育課程 
  SR_7159  Pascal 高級語言程序設計  全 64  集  吉林大學 遠距教育課程 
  SR_7113  JSP動態網頁設計  全 35  集  電子科技大學 遠距教育課程 
  SR_7112  JAVA程序設計  全 50  集  吉林大學 遠距教育課程 
  SR_7157  JAVA 面向對像程序設計  全 51  集  吉林大學 遠距教育課程 
  SR_7111  J2EE軟件架構技術  全 32  集  吉林大學 遠距教育課程 
  SR_7110  Fortran語言  全 29  集  石油大學 遠距教育課程 
  SR_7109  EJB 技術及應用  全 26  集  東北大學 遠距教育課程 
  SR_7108  Delphi 面向對像程序設計  全 50  集  中山大學 遠距教育課程 
  MS_5005  C編程方法學  全 87  集  武漢理工大學 國家級課程 
  SR_7107  C語言程序設計  全 68  集  哈爾濱工業大學 遠距教育課程 
  GS_6491  CC++程序設計  全 52  集  成都理工大学 本科國家級課程 
  SR_7156  C++語言程序設計  全 37  集  吉林大學 遠距教育課程 
  SR_7103  C++程序語言設計(上.下集)  全 80  集  東南大學 遠距教育課程 
  SR_7102  ASP開發教程  全 35  集  哈爾濱工業大學 遠距教育課程 
  SR_7101  ASP程序設計  全 41  集  中山大學 遠距教育課程 
  SR_7153   C語言 程式設計基礎  全 33  集  石油大學 遠距教育課程 
table>

  易學族課程網    http://www.estu.com.tw/  
    易學族自學網   http://www.estucourse.com/
電子信箱:   estuLearn@gmail.com     
               Copyright © 2017 Estu. All Rights Reserved