数据库学习笔记
mysql语法松散
orcal语法严格
sql
数据库需要:
字段名 数据类型 相关约束
DQL(数据查询语言) 查询 select都是DQL
DML(数据操作语言)insert delete upda对表数据进行增删改
DDL(数据定义语言)creat drop alter对表结构进行增删改
TCL(事务控制语言)commit提交事务 rollback回滚事务
DCL(数据控制语言)grant授权 rovoke撤销权限
初始化数据使用source命令、source在DOS下执行数据库文件。.sql文件
mysqle>source 数据库文件目录
null不是一个值,不能用=衡量,为空。必须使用is null或者is not null进行操作
sql语句
查询 :
select 字段名1,字段名2,.......from表名;
sql语句以分号结束,并且不区分大小写
并且字段可以参与数***算
中文需要加 ‘ ’ 不能直接写中文,标准sql语句 字符串使用单引号括起来
查询全部字段 select * from emp;实际开发不建议使用*,效率较低
条件查询 :
select字段......,字段 from 表名 where 条件;
执行顺序,先执行from在执行where在执行select
between and
求的是区间selsct enams, sal from emp where sal between 1000 and 3000 (求的是emp表enams字段中大于等于一千小于等于三千的)
使用时必须左小右大,是闭区间
in相当于or
模糊查询like
selsct enams from emp where ename like'%数据%'
_表示任意字符,需要查询 _时需要在 _ 前加/
%代表任意多个字符
排序:order by
默认表示升序 ,asc表示升序,desc表示降序
order by 字段 asc/desc;
order by 字段 asc/desc,字段asc/desc;
越靠前字段越能起主导作用
找出工作岗位是sal的员工,并按照工资降序排列
select ename, job,sal from emp where job=‘sal’ order by sal dose:
排序输出一般在最后执行
分组函数
count 计数
sum求和
avg平均值
max 最大值
min 最小值
一共五个,又叫多行处理函数//输入多行,输出一行
分组函数自动忽略null
单行处理函数 //输入一行输出一行。
只要在数据库中有null出现,无论进行什么运算操作,值只会为null
ifnull()空处理函数 属于单行处理函数
分组函数不可直接出现在where子句中
count *与count(具体字段)的差别
count *不是查询某个字段中数据的个数而是查出总记录条数
count(具体字段)表示的是字段中不为null的数据数量
分组函数也可以组合运用
group by与having
group by:按照某个字段或者某些字段进行分组
having:having是对分组之后的数据进行再次过滤
select xxx(max(sal)薪资最大值)(查询条件) from xxx(查询的表) group by(进行分组) xxx(按照这个进行分组):
分组函数一般与group by联合使用,并且分组函数一般在group by执行结束后才会执行,sql语句如果没有group by整张表自成一组。
当一个语句中有group by时,select后只能跟分组函数与参与分组的字段
select xxx(job,avg(sal))求工作岗位平均薪资)(查询条件) from xxx(查询的表) group by(进行分组) xxx(按照这个进行分组):
where与having相比效率较高
写了group by才会出现having
一个完整的DQL语句
select(4.选出数据)。。。。from()。。。where(1.首先执行where语句过滤原始数据)。。。group by(2.进行分组)。。。having(3.操作分组数据)。。。orde by(排序)。。。
写了group by才会出现having,能在where中过滤的数据尽量在where中过滤,效率较高
distinct关于查询结果集的去重,只能出现在所有字段的最前面
多表链接查询
一个业务分为多张表,在多张表中进行查询数据
分类 SQL92
SQL99
链接方式划分
内连接:等值连接,非等值连接,自连接、
外连接:左外连接,右外链接,全连接(全连接使用较少)
链接查询方右一种现象叫做(笛卡尔积现象)
select (表一字段)(表二字段) from (表一)(表二)
表示在对两张表进行链接查询时,没有对任何条件进行限制,最终查询结果条数是两张表的记录条数的乘积
关于表的别名
select (e.表一字段)(m.表二字段) from (e.表一)(m.表二)
执行效率高,可读性好
如何避免笛卡尔积现象
加条件进行过滤。不会减少匹配次数,只不过显示出来的是有效数据
select (e.表一字段)(m.表二字段)
from (e.表一)(m.表二)
where (e.条件=(m.条件)
内连接之等值连接
select (e.表一字段)(m.表二字段)
from (e.表一)
join (m.表二)
on (e.条件)=(m.条件)
连接与where分离
内连接之非等值连接,
连接条件中的关系是非等量关系
select (e.表一字段)(e.表一字段)(m.表二字段)
from (e.表一)
join (m.表二)
on (e.条件)between (m.条件) and(m.条件)
自连接
一张表看做两张表,自己连接自己
select
(a.xxx)as‘信息段 ’ (b.xxx)as‘信息段’
from
emp a
inner join
emp b
on a.xxx=b.xxx(可以等量关系也可以非等量关系)
a表的xxx等于b表的xxx
外连接
与内连接区别
内连接 AB两孩子那个表没有主副,两张表是平等的
外连接 AB两张表有一张表是主表有一个是附表,主要查询主表,顺带查询附表。当附表中的数据没有和主表中的数据匹配,附表自动生成null
左外连接,表示左边的表是主表
右外连接,表示右边的表是主表
...A join B join C on。。。
三张表进行查询
( select
e.表一 ,d.表二, c.表三
from
表名 e
join
表名 d
on
e.表一字段=d.表二字段
join
表名 c
on
e.表一 between d.表二 and c.表三 ;)
left join 表名e1
on
e.字段=e1.字段
子查询
select中嵌套select语句,嵌套的select是字查询
应用
select 。。。。。(select)
from 。。。。。(select)
where 。。。。。(select)
where
from后嵌套子查询
select
union可以将查询结果相加显示(两个不相干的表也可以)
limit 可以完成分页查询显示
mysql特有,不通用(oracle中有一个相同机制叫rownum)
limit取结果中的部分数据
语法机制
limit startIndex length (startIndex表示起始位置 length表示取几个 )
limit(pageNO-1)*pagesize,pagesize
建表
1.
creat table 表名(
字段名1 数据类型 字段名2 数据类型 。。。。。
);
数据类型 int 整型 bigint长整型 float浮点型 char定长字符串 varchar不定长字符串 data日期类型 BLOB二进制大对象 CLOB字符型大队象,可以存储4g的字符串
char与varchar如何选择
字段数据长度不变化时选择char变化或者不确定时选varchar
BLOL与CLOB类型应用
电影等
insert语句插入数据
语法要求:insert into (表名) (字段名1,字段名2.。。。) values (值1,值2.。。。)
- 可以同时插入多行
语法要求:insert into (表名) (字段名1,字段名2.。。。) values (),(),()
(字段名1,字段名2.。。。)//字段名可以省略、
5.表的复制
creat table 表名 as select 语句
将查询结果复制到一张表中
insert into deptl select *from dept
6.删除数据
delete from 表名 where 条件
删除表 truncate table 表;//表被截断不可回滚
7.update
update 表名 set 字段名1=值1,字段名2=值2... where 条件; 注意:没有条件整张表数据全部更新。
约束
对表中的字段添加约束,为了保证表数据的合法性,有效性,完整性。
非空约束 not null
唯一约束 unique(唯一性约束字段具有唯一性,不能重复,但可以为null)
主键约束 primary key
外键约束 foreign key
检查约束 check(oracle数据库有,mysql没有并且不支持)
约束直接加在字段后
create table 表名(
字段名 数据类型 约束)
主键约束
主键相关的术语?
主键约束 : primary key
主键字段 : id字段添加primary key之后,id叫做主键字段 主键值 : id字段中的每一个值都是主键值。
主键有什么作用?
- 表的设计三范式中有要求,第一范式就要求任何一张表都应该有主键。
- 主键的作用:主键值是这行记录在这张表当中的唯一标识。(就像一个人的身份证号码一样。)
主键的分类?
根据主键字段的字段数量来划分:
单一主键(推荐的,常用的。)
复合主键(多个字段联合起来添加一个主键约束)(复合主键不建议使用,因为复合主键违背三范式。)
根据主键性质来划分:
自然主键:主键值最好就是一个和业务没有任何关系的自然数。(这种方式是推荐的)
业务主键:主键值和系统的业务挂钩,例如:拿着银行卡的卡号做主键,拿着身份证号码作为主键。(不推荐用)
最好不要拿着和业务挂钩的字段作为主键。因为以后的业务一旦发生改变的时候,主键值可能也需要
随着发生变化,但有的时候没有办法变化,因为变化可能会导致主键值重复。一张表的主键约束只能有1个。(必须记住)
外键约束
顺序要求:
删除数据的时候,先删除子表,再删除父表。
添加数据的时候,先添加父表,在添加子表。
创建表的时候,先创建父表,再创建子表。
删除表的时候,先删除子表,在删除父表。关于外键约束的相关术语:
外键约束: foreign key
外键字段:添加有外键约束的字段
外键值:外键字段中的每一个值。
外键值可以为NULL?
外键可以为NULL。
外键字段引用其他表的某个字段的时候,被引用的字段必须是主键吗?
注意:被引用的字段不一定是主键,但至少具有unique约束
存储引擎
什么是存储引擎呢?
存储引擎这个名字只有在mysql中存在。(Oracle中有对应的机制,但是不叫做存储引擎。Oracle中没有特殊的名字,
就是“表的存储方式”)
mysql支持很多存储引擎,每一个存储引擎都对应了一种不同的存储方式。
每一个存储引擎都有自己的优缺点,需要在合适的时机选择合适的存储引擎。查看当前mysql支持的存储引擎?
show engines \G
常见的存储引擎?
Engine: MyISAM
Support: YES
Comment: MyISAM storage engine
Transactions: NO
XA: NO
Savepoints: NO
MyISAM这种存储引擎不支持事务。
MyISAM是mysql最常用的存储引擎,但是这种引擎不是默认的。
MyISAM采用三个文件组织一张表:
xxx.frm(存储格式的文件)
xxx.MYD(存储表中数据的文件)
xxx.MYI(存储表中索引的文件)
优点:可被压缩,节省存储空间。并且可以转换为只读表,提高检索效率。
缺点:不支持事务。
-----------------------------------------------------------------------------
Engine: InnoDB
Support: DEFAULT
Comment: Supports transactions, row-level locking, and foreign keys
Transactions: YES
XA: YES
Savepoints: YES
优点:支持事务、行级锁、外键等。这种存储引擎数据的安全得到保障。
表的结构存储在xxx.frm文件中
数据存储在tablespace这样的表空间中(逻辑概念),无法被压缩,无法转换成只读。
这种InnoDB存储引擎在MySQL数据库崩溃之后提供自动恢复机制。
InnoDB支持级联删除和级联更新。
-------------------------------------------------------------------------------------
Engine: MEMORY
Support: YES
Comment: Hash based, stored in memory, useful for temporary tables
Transactions: NO
XA: NO
Savepoints: NO
缺点:不支持事务。数据容易丢失。因为所有数据和索引都是存储在内存当中的。
优点:查询速度最快。
以前叫做HEPA引擎。事务
一个事务是一个完整的逻辑单元不可再分
两条DML语句必须同时成功,或者同时失败,不允许出现一条成功,一条失败。
要想保证以上的两条DML语句同时成功或者同时失败,那么就需要使用数据库的“事务机制”。
3.2、和事务相关的语句只有:DML语句。(insert delete update)
为什么?因为它们这三个语句都是和数据库表当中的“数据”相关的。
事务的存在是为了保证数据的完整性,安全性。
3.3、假设所有的业务都能使用1条DML语句搞定,还需要事务机制吗?
不需要事务。
但实际情况不是这样的,通常一个“事儿(事务【业务】)”需要多条DML语句共同联合完成。
3.4、事务的特性?
事务包括四大特性:ACID
A: 原子性:事务是最小的工作单元,不可再分。
C: 一致性:事务必须保证多条DML语句同时成功或者同时失败。
I:隔离性:事务A与事务B之间具有隔离。
D:持久性:持久性说的是最终数据必须持久化到硬盘文件中,事务才算成功的结束。
3.5、关于事务之间的隔离性
事务隔离性存在隔离级别,理论上隔离级别包括4个:
第一级别:读未提交(read uncommitted)
对方事务还没有提交,我们当前事务可以读取到对方未提交的数据。
读未提交存在脏读(Dirty Read)现象:表示读到了脏的数据。
第二级别:读已提交(read committed)
对方事务提交之后的数据我方可以读取到。
这种隔离级别解决了: 脏读现象没有了。
读已提交存在的问题是:不可重复读。
第三级别:可重复读(repeatable read)
这种隔离级别解决了:不可重复读问题。
这种隔离级别存在的问题是:读取到的数据是幻象。
第四级别:序列化读/串行化读(serializable)
解决了所有问题。
效率低。需要事务排队。
oracle数据库默认的隔离级别是:读已提交。
mysql数据库默认的隔离级别是:可重复读。
3.6、演示事务
* mysql事务默认情况下是自动提交的。
(什么是自动提交?只要执行任意一条DML语句则提交一次。)怎么关闭自动提交?start transaction;
* 准备表:
drop table if exists t_user;
create table t_user(
id int primary key auto_increment,
username varchar(255)
);
* 演示:mysql中的事务是支持自动提交的,只要执行一条DML,则提交一次。
mysql> insert into t_user(username) values('zs');
Query OK, 1 row affected (0.03 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
+----+----------+
1 row in set (0.00 sec)
mysql> rollback;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
+----+----------+
1 row in set (0.00 sec)
* 演示:使用start transaction;关闭自动提交机制。
mysql> start transaction;
Query OK, 0 rows affected (0.00 sec)
mysql> insert into t_user(username) values('lisi');
Query OK, 1 row affected (0.00 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
| 2 | lisi |
+----+----------+
2 rows in set (0.00 sec)
mysql> insert into t_user(username) values('wangwu');
Query OK, 1 row affected (0.00 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
| 2 | lisi |
| 3 | wangwu |
+----+----------+
3 rows in set (0.00 sec)
mysql> rollback;
Query OK, 0 rows affected (0.02 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
+----+----------+
1 row in set (0.00 sec)
--------------------------------------------------------------------
mysql> start transaction;
Query OK, 0 rows affected (0.00 sec)
mysql> insert into t_user(username) values('wangwu');
Query OK, 1 row affected (0.00 sec)
mysql> insert into t_user(username) values('rose');
Query OK, 1 row affected (0.00 sec)
mysql> insert into t_user(username) values('jack');
Query OK, 1 row affected (0.00 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
| 4 | wangwu |
| 5 | rose |
| 6 | jack |
+----+----------+
4 rows in set (0.00 sec)
mysql> commit;
Query OK, 0 rows affected (0.04 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
| 4 | wangwu |
| 5 | rose |
| 6 | jack |
+----+----------+
4 rows in set (0.00 sec)
mysql> rollback;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from t_user;
+----+----------+
| id | username |
+----+----------+
| 1 | zs |
| 4 | wangwu |
| 5 | rose |
| 6 | jack |
+----+----------+
4 rows in set (0.00 sec)
* 演示两个事务,假如隔离级别
演示第1级别:读未提交
set global transaction isolation level read uncommitted;
演示第2级别:读已提交
set global transaction isolation level read committed;
演示第3级别:可重复读
set global transaction isolation level repeatable read;
* mysql远程登录:mysql -h192.168.151.18 -uroot -p4444、索引
4.1、什么是索引?有什么用?
索引就相当于一本书的目录,通过目录可以快速的找到对应的资源。
在数据库方面,查询一张表的时候有两种检索方式:
第一种方式:全表扫描
第二种方式:根据索引检索(效率很高)
索引为什么可以提高检索效率呢?
其实最根本的原理是缩小了扫描的范围。
索引虽然可以提高检索效率,但是不能随意的添加索引,因为索引也是数据库当中
的对象,也需要数据库不断的维护。是有维护成本的。比如,表中的数据经常被修改
这样就不适合添加索引,因为数据一旦修改,索引需要重新排序,进行维护。
添加索引是给某一个字段,或者说某些字段添加索引。
select ename,sal from emp where ename = 'SMITH';
当ename字段上没有添加索引的时候,以上sql语句会进行全表扫描,扫描ename字段中所有的值。
当ename字段上添加索引的时候,以上sql语句会根据索引扫描,快速定位。
4.2、怎么创建索引对象?怎么删除索引对象?
创建索引对象:
create index 索引名称 on 表名(字段名);
删除索引对象:
drop index 索引名称 on 表名;
4.3、什么时候考虑给字段添加索引?(满足什么条件)
* 数据量庞大。(根据客户的需求,根据线上的环境)
* 该字段很少的DML操作。(因为字段进行修改操作,索引也需要维护)
* 该字段经常出现在where子句中。(经常根据哪个字段查询)
4.4、注意:主键和具有unique约束的字段自动会添加索引。
根据主键查询效率较高。尽量根据主键检索。
4.5、查看sql语句的执行计划:
mysql> explain select ename,sal from emp where sal = 5000;
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
| 1 | SIMPLE | emp | ALL | NULL | NULL | NULL | NULL | 14 | Using where |
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
给薪资sal字段添加索引:
create index emp_sal_index on emp(sal);
mysql> explain select ename,sal from emp where sal = 5000;
+----+-------------+-------+------+---------------+---------------+---------+-------+------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+---------------+---------+-------+------+-------------+
| 1 | SIMPLE | emp | ref | emp_sal_index | emp_sal_index | 9 | const | 1 | Using where |
+----+-------------+-------+------+---------------+---------------+---------+-------+------+-------------+
4.6、索引底层采用的数据结构是:B + Tree
4.7、索引的实现原理?
通过B Tree缩小扫描范围,底层索引进行了排序,分区,索引会携带数据在表中的“物理地址”,
最终通过索引检索到数据之后,获取到关联的物理地址,通过物理地址定位表中的数据,效率
是最高的。
select ename from emp where ename = 'SMITH';
通过索引转换为:
select ename from emp where 物理地址 = 0x3;
4.8、索引的分类?
单一索引:给单个字段添加索引
复合索引: 给多个字段联合起来添加1个索引
主键索引:主键上会自动添加索引
唯一索引:有unique约束的字段上会自动添加索引
....
4.9、索引什么时候失效?
select ename from emp where ename like '%A%';
模糊查询的时候,第一个通配符使用的是%,这个时候索引是失效的。5、视图(view)
5.1、什么是视图?
站在不同的角度去看到数据。(同一张表的数据,通过不同的角度去看待)。
5.2、怎么创建视图?怎么删除视图?
create view myview as select empno,ename from emp;
drop view myview;
注意:只有DQL语句才能以视图对象的方式创建出来。
5.3、对视图进行增删改查,会影响到原表数据。(通过视图影响原表数据的,不是直接操作的原表)
可以对视图进行CRUD操作。
5.4、面向视图操作?
mysql> select * from myview;
+-------+--------+
| empno | ename |
+-------+--------+
| 7369 | SMITH |
| 7499 | ALLEN |
| 7521 | WARD |
| 7566 | JONES |
| 7654 | MARTIN |
| 7698 | BLAKE |
| 7782 | CLARK |
| 7788 | SCOTT |
| 7839 | KING |
| 7844 | TURNER |
| 7876 | ADAMS |
| 7900 | JAMES |
| 7902 | FORD |
| 7934 | MILLER |
+-------+--------+
create table emp_bak as select * from emp;
create view myview1 as select empno,ename,sal from emp_bak;
update myview1 set ename='hehe',sal=1 where empno = 7369; // 通过视图修改原表数据。
delete from myview1 where empno = 7369; // 通过视图删除原表数据。
5.5、视图的作用?
视图可以隐藏表的实现细节。保密级别较高的系统,数据库只对外提供相关的视图,java程序员
只对视图对象进行CRUD。6、DBA命令
6.1、将数据库当中的数据导出
在windows的dos命令窗口中执行:(导出整个库)
mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p333
在windows的dos命令窗口中执行:(导出指定数据库当中的指定表)
mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot –p123
6.2、导入数据
create database bjpowernode;
use bjpowernode;
source D:\bjpowernode.sql7、数据库设计三范式(重点内容,面试经常问)
7.1、什么是设计范式?
设计表的依据。按照这个三范式设计的表不会出现数据冗余。
7.2、三范式都是哪些?
第一范式:任何一张表都应该有主键,并且每一个字段原子性不可再分。
第二范式:建立在第一范式的基础之上,所有非主键字段完全依赖主键,不能产生部分依赖。
多对多?三张表,关系表两个外键。
t_student学生表
sno(pk) sname
-------------------
1 张三
2 李四
3 王五
t_teacher 讲师表
tno(pk) tname
---------------------
1 王老师
2 张老师
3 李老师
t_student_teacher_relation 学生讲师关系表
id(pk) sno(fk) tno(fk)
----------------------------------
1 1 3
2 1 1
3 2 2
4 2 3
5 3 1
6 3 3
第三范式:建立在第二范式的基础之上,所有非主键字段直接依赖主键,不能产生传递依赖。
一对多?两张表,多的表加外键。
班级t_class
cno(pk) cname
--------------------------
1 班级1
2 班级2
学生t_student
sno(pk) sname classno(fk)
---------------------------------------------
101 张1 1
102 张2 1
103 张3 2
104 张4 2
105 张5 2
提醒:在实际的开发中,以满足客户的需求为主,有的时候会拿冗余换执行速度。
7.3、一对一怎么设计?
一对一设计有两种方案:主键共享
t_user_login 用户登录表
id(pk) username password
--------------------------------------
1 zs 123
2 ls 456
t_user_detail 用户详细信息表
id(pk+fk) realname tel ....
------------------------------------------------
1 张三 1111111111
2 李四 1111415621
一对一设计有两种方案:外键唯一。
t_user_login 用户登录表
id(pk) username password
--------------------------------------
1 zs 123
2 ls 456
t_user_detail 用户详细信息表
id(pk) realname tel userid(fk+unique)....
-----------------------------------------------------------
1 张三 1111111111 2
2 李四 1111415621 1
阿里云成长空间 753人发布