背景是:这两天在精选影视内容,已初步准(爬)备(虫)好了部分数据。(p.s. 对爬虫觉得兴趣的朋友请关注,后续会有爬虫系列发布)。须要把标具名符串拆分为数组,本文考试测验完备利用Mysql来处理,不借用其他工具。
一、数据处理——数组字段拆分
上来的第一个难题便是电影的类型字段,是个多值类似数组格式,须要拆分。网上也有很多不同的办理方案,要用到自定义函数、存储教程、临时中间表、json,步骤较长,不易理解。假如有简洁的方法就好了。

笔者昨天分享了with利用,恰好个中有利用with的递归来办理问题。还记得笔者是怎么对with评价的吗?那便是具备了编程措辞的功能,本日再感想熏染一回神奇魔力吧。
直接上图,简洁流畅,with的递归真是妙不可言。
二、统计剖析
1、大略统计
2、窗口函数统计
3、关联过滤——inner join
三、作业
准备好的这份新数据,不但有以上的实战练习case,还有很多可做的。留下几道作业,有兴趣的朋友请在"大众号后台回答sql获取数据库账号进行练习。
每年上映的评分最高和最低的剧影出演过至少2部的演员有哪些,按部数倒序单一导演和联合导演的剧影评分比拟评分前100的剧影来自哪些国家地区以上作业代表是不同角度来剖析——便是维度,常日以dim表示,还可以有维度交叉进行剖析,后续文章再予分享,敬请关注。
解释:当前数据不完备,有些统计的结果不具有代表意义,权当演习。当数据集到一定规模后,再实行统计和剖析,期待后续故意思的创造。
上一篇:sql高等查询with表达式,教程给你备好了 (推举量7万+)