首页 » 网站建设 » php爬虫教程视频交换技巧_python项目实战爬取youku视频播放链接

php爬虫教程视频交换技巧_python项目实战爬取youku视频播放链接

duote123 2024-11-16 0

扫一扫用手机浏览

文章目录 [+]

接下来为大家先容Python爬取youku视频的播放链接,直接放在网页就可以看了,废话不多说,直接上代码吧

首先导入库

php爬虫教程视频交换技巧_python项目实战爬取youku视频播放链接

import randomimport reimport requests

发起要求

php爬虫教程视频交换技巧_python项目实战爬取youku视频播放链接
(图片来自网络侵删)

def get_request(url, user_agent): '''参数引入及头信息''' if len(user_agent) < 10: user_agent = 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:39.0) Gecko/20100101 Firefox/39.0' # 此处修正头字段, headers = { 'Host': \"大众v.youku.com\"大众, \公众Accept\"大众: \公众text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8\"大众, \"大众Accept-Encoding\"大众: \公众gzip, deflate, sdch\公众, \"大众Accept-Language\"大众: \公众zh-CN,zh;q=0.8\"大众, 'Cache-Control': 'no-cache', \"大众Connection\公众: \公众keep-alive\"大众, \"大众User-Agent\"大众: user_agent, 'Referer': 'http://www.youku.com/' } try: html = requests.get(url, headers=headers, timeout=20).text # print html return html except Exception, e: print(Exception, e) return -1

学习从来不是一个人的事情,要有个相互监督的伙伴,事情须要学习python或者有兴趣学习python的伙伴可以私信回答

主函数实行

if __name__ == '__main__': # 此url为任意一个具有某视频播放窗口的页面 url = \"大众http://v.youku.com/v_show/id_XMTgzNDI0MjkzNg==.html?from=y1.3-movie-grid-1095-9921.86985-107667.1-1&spm=a2hmv.20009921.yk-slide-107667.5~5~5~5!2~A#paction\公众 # 导入数据集并随机获取一个User-Agent user_agent_list = [] f = open('user_agent.txt', 'r') for date_line in f: user_agent_list.append(date_line.replace('\r\n', '')) user_agent = random.choice(user_agent_list) # 发起要求 html_body = get_request(url, user_agent) print(re.findall('http://player.youku.com/player.php/sid/[A-Za-z0-9=]/v.swf', html_body))

将此链接放在浏览器中可以直接播放,虽然有广告...但是还是能实现的,欢迎大家一起学习,共同互换

标签:

相关文章

微信第三方登录便捷与安全的完美融合

社交平台已成为人们日常生活中不可或缺的一部分。微信作为我国最受欢迎的社交软件之一,拥有庞大的用户群体。为了方便用户在不同平台间切换...

网站建设 2025-02-18 阅读0 评论0

广东高速代码表解码高速公路管理智慧

高速公路作为国家交通动脉,连接着城市与城市,承载着巨大的物流和人流。广东作为我国经济大省,高速公路网络密布,交通流量巨大。为了更好...

网站建设 2025-02-18 阅读0 评论0

工程量代码建筑行业的数字化密码

数字化已成为各行各业转型升级的重要方向。在建筑行业,工程量代码作为一种数字化工具,正逐渐改变着传统的工程管理方式。本文将从工程量代...

网站建设 2025-02-18 阅读0 评论0