今天来爬爬音乐,一丝丝的无聊
前期准备
软件环境
- Python3.8
- pycharm
模块
requests、re、os 三个
其中requests是第三方模块需要手动安装一下
re、os都是内置模块,不需要安装
浏览器开发者工具
咱们需要学会如何使用开发者工具。
对此很多小伙伴都不会,因为每个浏览器的开发者工具细节上多少有一些差别,我建议都用谷歌浏览器,英文看不懂的话可以调成中文。
打开开发者工具,点击省略号,点击 shortcuts
依次点击 preferences – language ,
直接拉到最下方选择中文即可。
代码实现
本次实现步骤大致分为以下五步:
- 发送请求
- 获取数据
- 解析数据
- 保存数据
这里我就不讲怎么分析开发者工具了,有空(摸鱼 )做一个详细的教程,讲解开发者工具。
导入模块
import requests
import re
import os
发送请求
url = 'https://网址自己打一下/discover/toplist?id=3778678'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
获取数据
result = re.findall('li>a href="/song?id=(d+)">(.*?)/a>/li>', response.text)
for music, title in result:
music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
music_content = requests.get(url=music_url, headers=headers).content
保存数据
with open(filename + title + '.mp3', mode='wb') as f:
f.write(music_content)
print(title)
当然这只是最简单的爬取榜单歌曲,
评论、歌词等等都可以爬取,
还有制作词云图、通过搜索下载,音乐下载器,
等等各种实现下载的方式。
好了,今天的分享就到这里,完整代码下方名片获取哈~
服务器托管,北京服务器托管,服务器租用 http://www.fwqtg.net
相关推荐: Python之路,Day18 – 开发一个WEB聊天来撩妹吧
本节内容: 项目实战:开发一个WEB聊天室 功能需求: 用户可以与好友一对一聊天 可以搜索、添加某人为好友 用户可以搜索和添加群 每个群有管理员可以审批用户的加群请求,群管理员可以用多个,群管理员可以删除、添加、禁言群友 可以与聊天室里的人进行临时…