CharlesXiao‘s Blog

MySQL函数

SQL中操作日期和年月的函数：SELECT DAYOFWEEK(‘2013-12-1’), DAYOFMONTH(‘2013-12-1’), WEEKDAY(‘2013-12-1’),DAYOFYEAR(‘2013-12-1’), DAYNAME(‘2013-12-1’), MONTHNAME(‘2013-12-1’), WEEK(‘2013-12-1’)\G;
字符串操作函数：length(), concat(), concat_ws(), RTRIM(), LTRIM(), RPAD(), LPAD(), LOCATE(), SUBSTRING(), LCASE(), UCASE(), REPEAT();
时间处理函数：HOUR(), MINUTE(), SECOND(); 时间格式处理函数：SELECT DATE_FORMAT(‘2013-12-01 02:02:00’, ‘%h:%i:%S’) AS sample_time
日期算数函数：SELECT DATE_ADD(NOW(), INTERVAL 21 DAY); DATE_SUB(), CURDATE(), CURTIME(), NOW(), UNIX_TIMESTAMP(), FROM_UNIXTIME()
SQL事务处理：BEGIN—-ROLLBACK—-COMMIT

PHP与SQL交互：

$mysqli = mysqli_connect("hostname(localhost)", "uername", "password", "database");
$sql = "SQL语句";
$res = mysqli_query($mysqli, $sql);//执行mysqli_query函数，如果正确执行则返回true，否则返回false；
可以使用mysqli_error($mysqli)输出
mysqli_free_result();//在关闭之前释放空间
mysqli_close($mysqli)；
mysqli_fetch_array()函数获取每一行记录作为一个数组，使用while循环可以遍历一次所有记录

MySQL概念

主键—唯一标识一条记录，不能有重复的，不允许为空。一个表的主键只能有一个。用来保证数据完整性
外键—表的外键是另一表的主键, 外键可以有重复的, 可以是空值。一个表可以有多个外键。用来和其他表建立联系用的
索引—该字段没有重复值，但可以有一个空值。一个表可以有多个唯一索引。提高查询排序的速度
外键取值规则：空值或参照的主键值。

(1)插入非空值时，如果主键表中没有这个值，则不能插入。

(2)更新时，不能改为主键表中没有的值。

(3)删除主键表记录时，你可以在建外键时选定外键记录一起级联删除还是拒绝删除。

(4)更新主键记录时，同样有级联更新和拒绝执行的选择

MySQL常用操作

建立主键:

alter table 表名
add constraint PK_字段名--"PK"为主键的缩写，字段名为要在其上创建主键的字段名,'PK_字段名'就为约束名
primary key (字段名) --字段名同上

增加唯一约束:

alter table 表名
add constraint UQ_字段名
unique (字段名)

增加外键约束：

alter table 表名
add constraint FK_字段名--"FK"为外键的缩写
foreign key (字段名) references 关联的表名(关联的字段名) --注意'关联的表名'和'关联的字段名'

常见join方式
- LEFT(OUTER) JOIN
- RIGHT(OUTER) JOIN
- INNER JOIN
建立索引：ALTER TABLE table_name ADD INDEX index_name(‘name’, ‘age’);
删除索引的2种方法
- DROP INDEX index_name on table_name;
- ALTER table table_name drop key index_name; 可以删除被外键约束的索引
select * from mysql.user \G; 查看数据库用户权限
show warnings\G; —- 查看mysql优化过程

MySQL索引的建立规则

在 where 及 order by 涉及的列上建立索引,避免全表扫描
应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，尤其是is not null会导致全表扫描，如： select id from t where num is null 可以在num上设置默认值0，确保表中num列没有null值，然后这样查询： select id from t where num=0
当索引列有大量数据重复时,也就是选择性极低时，查询可能不会去利用索引，还不如直接全表扫描；如一表中有字段sex，male、female几乎各一半，那么即使在sex上建了索引也对查询效率起不了作用。
索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引；一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。
尽量使用数字型字段，若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符，而对于数字型而言只需要比较一次就够了
尽可能的使用 varchar/nvarchar 代替 char/nchar ，因为首先变长字段存储空间小，可以节省存储空间，其次对于查询来说，在一个相对较小的字段内搜索效率显然要高些
避免频繁创建和删除临时表，以减少系统表资源的消耗
在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert。
如果使用到了临时表，在存储过程的最后务必将所有的临时表显式删除，先 truncate table ，然后 drop table ，这样可以避免系统表的较长时间锁定
应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描
(新版本已经会使用到索引)应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如： select id from t where num=10 or num=20 可以这样查询： select id from t where num=10 union all select id from t where num=20
in 和 not in 也要慎用，否则会导致全表扫描，如： select id from t where num in(1,2,3) 对于连续的数值，能用 between 就不要用 in 了： select id from t where num between 1 and 3
下面的查询也将导致全表扫描： select id from t where name like ‘%abc%’
如果在 where 子句中使用参数，也会导致全表扫描。因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描： select id from t where num=@num 可以改为强制查询使用索引： select id from t with(index(索引名)) where num=@num
应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如： select id from t where num/2=100 应改为: select id from t where num=100*2

应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：

select id from t where substring(name,1,3)=’abc’   –name以abc开头的id 
select id from t where datediff(day,createdate,’2005-11-30′)=0       –‘2005-11-30’生成的id 
应改为: select id from t where name like ‘abc%’ select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′

不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引
很多时候用 exists 代替 in 是一个好的选择： select num from a where num in(select num from b) 用下面的语句替换： select num from a where
exists(select 1 from b where num=a.num)
任何地方都不要使用 select from t ，用具体的字段列表代替“”，不要返回用不到的任何字段。
尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万行，那么就应该考虑改写
尽量避免向客户端返回大数据量，若数据量过大，应该考虑相应需求是否合理
尽量避免大事务操作，提高系统并发能力。
最有可能影响SQL性能的是磁盘和网络吞吐量
能够采用存储过程实现的对数据库的操作尽量通过存储过程来实现
不良的SQL往往来自于不恰当的索引设计、不充份的连接条件和不可优化的where子句。在对它们进行适当的优化后，其运行速度有了明显地提高
在不加WHERE限制条件的情况下，COUNT()与COUNT(COL)基本可以认为是等价的；但是在有WHERE限制条件的情况下，COUNT()会比COUNT(COL)快非常多；
COUNT(*)通常是对主键进行索引扫描，而COUNT(COL)就不一定了，另外前者是统计表中的所有符合的纪录总数，而后者是计算表中所有符合的COL的纪录数。
两表join时，inner join 和 left join 差不多,都需要优化右表(join字段加索引)，而 right join 需要优化左表

MySQL explain/explain extended含义

id列：MySQL Query Optimizer 选定的执行计划中查询的序列号。表示查询中执行 select 子句或操作表的顺序,id值越大优先级越高,越先被执行。id 相同,执行顺序由上至下。
select_type 列
MySQL 把 SELECT 查询分成简单和复杂两种类型，复杂类型又可以分成三个大类：简单子查询、所谓的衍生表（子查询在 FROM 子句里）和 UNION 。SIMPLE：查询中不包含子查询或者UNION；
PRIMARY:子查询上层；
SUBQUERY：子查询；
DERIVED：在FROM列表中包含子查询， MySQL会递归执行这些子查询，把结果放在临时表里
type 列
MySQL 在表里找到所需行的方式。包括（由左至右，由最差到最好）：| All | index | range | ref | eq_ref | const,system | null
- ALL：全表扫描，MySQL 从头到尾扫描整张表查找行
- index：按索引次序扫描表，就是先读索引，再读实际的行，其实还是全表扫描。主要优点是避免了排序，因为索引是排好序的。
- range：以范围的形式扫描索引
- ref：非唯一性索引访问
- eq_ref：使用有唯一性索引查找（主键或唯一性索引）；唯一性索引才会出现 eq_ref （非唯一性索引会出现 ref ），因为唯一，所以最多只返回一条记录，找到后无需继续查找，因此比 ref 更快。
- const：被称为“常量”，这个词不好理解，不过出现 const 的话就表示发生下面两种情况：在整个查询过程中这个表最多只会有一条匹配的行，比如主键 id=1 就肯定只有一行，只需读取一次表数据便能取得所需的结果，且表数据在分解执行计划时读取。例如：select * from a where id=1\G ；只有唯一性索引才能保证表中最多只有一条记录，只有这样 type 才有可能为 const 。为 id 加普通索引后， type 变为 ref ，改为加唯一或主键索引后， type 便变为 const 了。
- system：system 是 const 类型的特例，当表只有一行时就会出现 system 。
- NULL：在优化过程中就已得到结果，不用再访问表或索引。例如：select min(a_id) from a\G
key_len 列：索引字段最大可能使用的长度。
key 列：查询过程中实际使用的索引；可以在 SELECT 语句中使用 USE INDEX (indexname)来强制使用一个索引或者用 IGNORE INDEX(indexname)来强制 MYSQL 忽略索引
ref 列：指出对 key 列所选择的索引的查找方式，常见的值有 const, func, NULL, 具体字段名。当 key 列为 NULL ，即不使用索引时，此值也相应的为 NULL 。
rows 列：MySQL 估计的需要扫描的行数
Extra 列：
- Using index: 此查询使用了覆盖索引(Covering Index)，即通过索引就能返回结果，无需访问表
- Using where：表示 MySQL 服务器从存储引擎收到行后再进行“后过滤”（Post-filter）。所谓“后过滤”，就是先读取整行数据，再检查此行是否符合 where 句的条件，符合就留下，不符合便丢弃。因为检查是在读取行后才进行的，所以称为“后过滤”。
- Using temporary：使用到临时表；MySQL 使用临时表来实现 distinct 操作；常见于排序 order by 和分组查询 group by
- Using filesort：若查询所需的排序与使用的索引的排序一致，因为索引是已排序的，因此按索引的顺序读取结果返回，否则，在取得结果后，还需要按查询所需的顺序对结果进行排序，这时就会出现 Using filesort
- 当 type 为 rang、 ref 或者 index 的时候才有可能利用索引排序，其它，如 ALL ，都无法通过索引排序，此时若有 order by ，如上例，便会出现 Using filesort 。但是当扫描的行过多时，MySQL 直接改用全表扫描，再 Using filesort ，不再使用索引。也就是说， MySQL 会根据表中的信息及查询来决定使用任种方式。
- Select tables optimized away：这个值意味着仅通过使用索引，优化器可能仅从聚合函数结果中返回一行。
- 优化器会在索引存在的情况下，通过符合 RANGE 范围的条数和总数的比例来选择是使用索引还是进行全表遍历,这是为了避免过多的 random disk.
  
  — 不使用索引(customer_id)
  EXPLAIN SELECT FROM rental WHERE customer_id<103;
  — 使用索引
  EXPLAIN SELECT FROM rental WHERE customer_id<102;
  — 其中 id < 103 的行数为 2767, id < 102 的行数为 2734
- “Using Index; Using where” it means that first the index is used to retrieve the records (an actual access to the table is not needed) and then on top of this result set the filtering of the where clause is done. For example: SELECT id FROM test WHERE id > 5;
- “Using index condition” 的理解是, 首先 mysql server 和 storage engine 是两个组件, server 负责 sql的parse, 执行; storage engine 去真正的做数据/index的读取/写入. 以前是这样: server 命令 storage engine 按 index 把相应的数据从数据表读出, 传给server, server来按 where条件做选择; 现在 ICP则是在可能的情况下, 让storage engine 根据index 做判断, 如果不符合条件则无须读数据表. 这样节省了disk IO. Link

MySQL数据类型选择

varchar和text

当超过255的长度之后，使用varchar和text没有本质区别，text没有默认值；推荐使用varchar（10000），毕竟这个还有截断，可以保证字段的最大值可控，如果使用text那么如果code有漏洞很有可能就写入数据库一个很大的内容，会造成风险；
当varchar大于某些数值的时候，其会自动转换为text，大概规则如下：
- 大于varchar（255）变为 tinytext
- 大于varchar（500）变为 text
- 大于varchar（20000）变为 mediumtext
char的上限为255字节，varchar的上限65535字节，text的上限为65535。char在存储的时候会截断尾部的空格，varchar和text不会。MySQL之char、varchar和text的设计

参考链接

Mysql explain结果解读

最近突然又开始面临一些抉择，本该尘埃落定的工作生活突然被一封邮件打乱了，想起来回顾一下自己的找工作历程。从16年4月份的开始找实习，一直到到16年11月底科大硕士毕业，中间一边在网易实习，一边准备各种面试，电面、视频面、现场面，一应俱全，个中滋味，五味杂陈，不足为外人道。可以说是一个艰难而又逐渐对自己认识明晰的过程。就好像当年本科毕业时一边在百度实习，一边DIY准备硕士申请一样，困难与压力并存却也收获颇丰。一旦有了一个明确的目标，那就只能不断地向它靠近再靠近，中间会有高低起伏，峰回路转，坚持就是胜利；所谓尽人事，安天命。

仔细算来，我是从大三才开始写代码，开始接触Java，第一份实习去了师兄的创业公司，接触到Android开发，后来到大四又去了百度移动搜索做Android开发；起初打算吃技术这碗饭，也只是想着将来不至于身无长技，流落街头，后来意识到这是不对的，做一行还是得精一行，虽然直到现在代码也是写的挺烂的，可能也是缺乏一定的技术激情，写代码会有兴奋感，也没有那么强，有待发掘。

直到硕士临近毕业参加校招，才发现真的需要靠专业技术来安身立命了，第一份工作既不想舍弃大学的专业，也很难再有码农之外的好的选择，即使有，也是和coding息息相关的了。一开始是实习面试，遭遇各种挫折，每天做的事情基本是投简历，改简历，准备面试，查漏补缺；这一段经历在之前的博文中有提到过，暂且不表，幸好这段经历也为校招做好了铺垫。

校招分为几个部分，内推、统招、散招。内推的信息基本上都来自于部分实验室内部传播或者学校论坛内部传播，而且往往要求比较高，往往会专注于某个方向，因为一般都是某个方向的团队在招人，比如存储、广告、推荐这些具体的方向；内推这种形式对于MSC来说其实是毫无优势的，一方面没有实验室的内推人脉，信息相对比较闭塞，幸好还有北邮人论坛来获取这方面的信息，打进了内部；另一方面，授课型的master学业时间较短，也很难在某个方向上有深度研究，很难满足内推的要求；统招就是各大互联网公司的统一秋招了，一般是统一笔试再加上多轮面试了

所谓面试，三分运气，七分实力，八二定律展露无遗。校招中，20%的大牛收割掉了80%的special offer，剩下的80%的人去瓜分批发价和20%的sp，大家都各有各的纠结。最大的感触之一是如果你是一个90分以上水平的人，那么你可以凭你的实力去砍一堆offer,但是如果你是一个70到90分之间的候选人，从实力来讲，彼此并没有太大的区别，就靠那么三分运气了。

这次往沪，某种意义上来讲对我来说是一次很重要的选择，曾经的北上帝都，心里也只是把它当做人生的过渡之处，最终还是要南下回到珠三角这个离家乡、亲人、朋友比较近的地方。而这一次，确是抱着换个地方奋斗的念头了。这几年从妖都到鹏城，再到HK, 辗转帝都，现在又去魔都，真是凑齐了个大满贯。每次搬家寄行李都嫌麻烦，但有时候转念想想，还年轻，跑一跑也无妨，现在不转转，过几年之后估计更难换城市了，也就释然了。

换一个城市，就是一个新的开始。虽然成本很大，甚至要牺牲一些东西，比如金钱，当然这也可能只是暂时的（极力安慰自己目光要长远……)。

MySQL基础知识

MySQL函数

MySQL概念

MySQL常用操作

MySQL索引的建立规则

MySQL explain/explain extended含义

MySQL数据类型选择

varchar和text

参考链接

Mac安装配置mySQL/mongodb/Redis开发环境及开机自启动

Redis基础知识

Redis事务

Redis管道pipeline

毕业求职漫漫路

DuoBao项目代码学习笔记

Dubbo框架