From 04c4b1b6a2e883619a376f262b3c6e7a6fc16b09 Mon Sep 17 00:00:00 2001 From: mba1398 <26516464+mba1398@users.noreply.github.com> Date: Mon, 10 Jun 2024 18:41:01 +0800 Subject: [PATCH] =?UTF-8?q?=E5=88=A0=E9=99=A4=E9=83=A8=E5=88=86=E9=A2=98?= =?UTF-8?q?=E7=9B=AE?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ch06:决胜秋招.md | 45 +++++---------------------------------------- 1 file changed, 5 insertions(+), 40 deletions(-) diff --git a/ch06:决胜秋招.md b/ch06:决胜秋招.md index b9fe04b..fde1753 100644 --- a/ch06:决胜秋招.md +++ b/ch06:决胜秋招.md @@ -213,40 +213,7 @@ 没有人向自己汇报。 -### 练习七:查询回答率最高的问题 (难度:中等) - -求出**survey_log**表中回答率最高的问题,表格的字段有:**uid, action, question_id, answer_id, q_num, timestamp**。 - -uid是用户id;action的值为:“show”, “answer”, “skip”;当action是"answer"时,answer_id不为空,相反,当action是"show"和"skip"时为空(null);q_num是问题的数字序号。 - -写一条sql语句找出回答率(`show 出现次数 / answer 出现次数`)最高的 `question_id`。 - -**举例:** - -**输入** - -| uid  | action | question_id  | answer_id  | q_num|timestamp  | -|:----|:----|:----|:----|:----|:----| -|5| show      |285| null       |1|123| -|5| answer    |285|124124|1|124| -|5| show      |369| null       |2|125| -|5| skip      |369| null       |2|126| - -**输出** - -|question_id | -|:----| -|285 | - -**说明** - -问题285的回答率为1/1,然而问题369的回答率是0/1,所以输出是285。 - -**注意:** - -最高回答率的意思是:同一个问题出现的次数中回答的比例。 - -### 练习八:各部门前3高工资的员工(难度:中等) +### 练习七:各部门前3高工资的员工(难度:中等) 将练习一中的 `employee` 表清空,重新插入以下数据(也可以复制练习一中的 `employee` 表,再插入第5、第6行数据): @@ -276,7 +243,7 @@ uid是用户id;action的值为:“show”, “answer”, “skip”; ``` 此外,请考虑实现各部门前N高工资的员工功能。 -### 练习九:平面上最近距离 (难度: 困难) +### 练习八:平面上最近距离 (难度: 困难) **point_2d**表包含一个平面内一些点(超过两个)的坐标值(x,y)。 @@ -304,7 +271,7 @@ uid是用户id;action的值为:“show”, “answer”, “skip”; ``` **注意:**所有点的最大距离小于10000。 -### 练习十:行程和用户(难度:困难) +### 练习九:行程和用户(难度:困难) Trips 表中存所有出租车的行程信息。每段行程有唯一键 Id,Client_Id 和 Driver_Id 是 Users 表中 Users_Id 的外键。Status 是枚举类型,枚举成员为 (‘completed’, ‘cancelled_by_driver’, ‘cancelled_by_client’)。 @@ -550,9 +517,7 @@ INSERT INTO t_act_records VALUES('u1004', 20210105); +---------+------------+ ``` -### 练习五:hive 数据倾斜的产生原因及优化策略? - -### 练习六:LEFT JOIN 是否可能会出现多出的行?为什么? +### 练习五:LEFT JOIN 是否可能会出现多出的行?为什么? 假设 t1 表有6行(关联列 name 有2行为空),t2 表有6行(关联列 name 有3行为空), @@ -567,5 +532,5 @@ t2 表: ### 写一写本次组队学习的收获。 -如果本课程对你有帮助的话,欢迎 `star` ~~ +如果本教程对你有帮助的话,欢迎 `star` ~~