相信許多老司機對「Xvideos.com」這個網站應該不陌生,此專案「XD」全名為「Xvideos Downloader」,顧名思義就是下載 Xvideos 影片用的程式 (不需擁有 Xvideos 帳號)。同時,這也是我第一個 Python 專案。
前言 (初次接觸Python)
近期突然想玩玩看爬蟲 (Crawler),也在此刻才開始接觸腳本語言 - Python (蟒蛇)。
其實早在兩三年前,友人「Honor」就推坑過我,可惜當時在我心中C語言的那種架構才是王道(其他都邪教),所以我只接觸諸如C#、PHP這類語言。至於爬蟲,基本上是0經驗,硬要說的話,只有以前高中做專題時,用PHP去抓 OpenData 的資料來使用的經驗而已。
而我必須說,Python 當初開發時的構想「易懂易學」真的做到了!
這個專案是我接觸 Python 兩個小時後就開始製作的,約不到兩天就成功產出。
建議還沒玩過 Python 的朋友們可以開始入坑了(X
題材選擇 (為什麼是Xvideos?)
人的生理需求中,就有那麼一項可以當作題材 - 「性」。
很多時候我會想,如果我要架服務,怎樣的服務賺錢最輕鬆?
雖然說 Pornhub 已經是主流,但「色情」不像 Google 跟 Youtube 這麼嚴重,只要有色的地方,就會有流量!今天不管世界上色情網站有多少個(競爭者多),但只要有新的一出現,一樣會有不少人潮來光顧(人類本性)。
總有一部分的使用者,會因為網站風格、界面跟操作方式而被吸引成為常客、加入會員甚至使用付費服務。
於是我開始嘗試製作 Pornhub 爬蟲,但最終還是放棄。
原因是,研究了半個小時過去,還是不明白哪裡可以爬,影片請求的部份有 Hash 驗證,在加上自己本身這方面知識不足,如果繼續研究太浪費時間了。
雖說登入會員就有資料可以給它 Hash ,但是既然都要登入會員了,那就用 Pornhub 自己提供的下載功能就好了…而我也不可能創建公共帳號給各位去使用吧(奇特思路),畢竟「大多數人」看片是不註冊會員的,所以我想製作的爬蟲是不用登入也可以抓檔的。
於是矛頭指向了同樣位於色情影片網站高地位的「Xvideos」。
我該如何使用?
我已經將專案放在我的Github上了。
你可以透過 Python3 (或更高版) 運行目錄下的 main.py 來使用。
若你不清楚什麼是 Python 腳本,你可以在 Wiki 得到答案,安裝方法也可以透過Google搜尋輕鬆找到。
也推薦 Windows 用戶可以使用「PyInstaller」來將 .py 打包成 windows 的 .exe 執行檔。
這也算不上是什麼專案,應該說是我自己的「Python 爬蟲練習」而已,如果你不喜歡,那麼請看看就好,請勿使用。
喔對了,你可以任意的修改、使用並發布更新,若你覺得不錯也可以轉傳給朋友們,但請聲明來源,這是一個對創作者的尊重。