如何在 MySQL 中设置默认的字符集和排序规则
connygpt 2024-12-10 13:38 15 浏览
在MySQL中,字符集的选择和排序规则的设置会直接影响到数据库数据的存储以及字符串的处理性能。所谓的字符集(character set)是在MySQL数据库中定义的一组字符及其编码,而排序规则(collation)定义的字符的比较和排序规则。通过默认字符集和排序规则的配置可以有效的避免出现各种的字符编码问题,同时还可以有效的提高系统数据格式的兼容性。下面我们就来详细介绍一下如何设置MySQL的默认字符集以及排序规则。
什么是字符集和排序规则?
在上面的介绍中,我们提到,字符集其实是一个字符的集合,这集合为每个字符分配了一个唯一的编码规则,例如MySQL中常见的编码规则。
- utf8mb4:支持所有Unicode字符,推荐使用。
- latin1:MySQL的传统字符集,只支持基本的拉丁字符。
而所谓的排序规则是指字符集合的复杂属性操作,在排序规则中指定的是如何对字符集中字符进行比较和排序,如下所示,是MySQL中常见的字符排序规则。
- utf8mb4_general_ci:大小写不敏感的通用排序规则。
- utf8mb4_bin:二进制排序规则,区分大小写。
为什么要设置默认字符集和排序规则?
说了这么多?很多人还不了解为什么要为数据库设计字符集以及排序规则。设置数据库字符集和排序规则可以有效的避免因为不同的字符编码导致的字符显示异常的问题,通过统一的字符集以及排序规则的设计我们可以减少手动去进行字符转换的操作,提升了数据操作的效率,另外作为默认的字符集utf8mb4几乎可以表示现实世界中所有的语言以及符号,这里所说的符号包括表情符号。
设置默认字符集和排序规则的方法
在 MySQL 配置文件中设置
这种方式是一种全局的配置方式,适用于整个的MySQL实例。可以在MySQL的配置文件my.cnf或者是my.ini的[mysqld]部分中添加如下的配置来实现。
[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_general_ci
配置完成之后,我们需要重启MySQL服务确保配置生效。
sudo systemctl restart mysql
通过如下的方式来验证上面的配置是否起作用。
SHOW VARIABLES LIKE 'character_set_server';
SHOW VARIABLES LIKE 'collation_server';
在创建数据库时设置
当然如果不想进行全局的配置,那么我们可以在创建数据库的时候对数据进行单独字符集以及排序规则的设置,如下所示。
CREATE DATABASE my_database
CHARACTER SET utf8mb4
COLLATE utf8mb4_general_ci;
创建完成之后,我们可以通过如下的方式来验证是否设置成功了。
SELECT schema_name, default_character_set_name, default_collation_name
FROM information_schema.schemata
WHERE schema_name = 'my_database';
在创建表时设置
如果只需要在特定的数据库表中使用指定的字符集以及排序规则,我们可以在创建数据库表的时候对其字符集以及排序规则进行指定,如下所示。
CREATE TABLE my_table (
id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(100)
) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
可以通过如下的方式来验证是否配置成功。或者是可以通过它来查看现有库表的字符集以及排序规则。
SHOW TABLE STATUS LIKE 'my_table';
修改已有的数据库或表
如果需要对现有已经存在的库表结构进行字符集和排序规则的修改,我们可以通过ALTER语句来进行操作,
修改数据库的字符集以及排序规则。
ALTER DATABASE my_database
CHARACTER SET utf8mb4
COLLATE utf8mb4_general_ci;
修改数据表的字符集和排序规则
ALTER TABLE my_table
CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
检查MySQL当前的字符集和排序规则
当然在不知道当前数据库表是什么字符集和排序规则的时候,我们可以通过如下的命令来查看MySQL数据库的字符集和排序规则。
检查全局字符集和排序规则
SHOW VARIABLES LIKE 'character_set_%';
SHOW VARIABLES LIKE 'collation_%';
检查数据库级别的设置
SELECT schema_name, default_character_set_name, default_collation_name
FROM information_schema.schemata;
检查数据库表级别的配置
SHOW TABLE STATUS WHERE Name = 'my_table';
检查数据表列级别的字符集配置
SELECT column_name, character_set_name, collation_name
FROM information_schema.columns
WHERE table_name = 'my_table';
常见问题和解决方案
首先比较常见的问题就是因为字符集不匹配导致数据乱码,我们可以通过如下的方式来配置客户端和服务器端使用了同样的字符集。
[client]
default-character-set = utf8mb4
其次,在一些场景中由于排序规则的不同可能会导致系统查询性能受到一定的影响,例如对于排序规则来说utf8mb4_unicode_ci的排序虽然准确但是效率较低,如果对于系统性能要求较高可以采用utf8mb4_general_ci排序来实现,又如,在一些场景中需要大小写敏感,这个时候我们可以通过utf8mb4_bin来实现排序规则检查。
最后遇到的比较多的就是表示范围,一般情况下在系统中需要确保使用utf8mb4字符集而不是utf8字符集,因为utf8不支持4字节字符,所以对于有些中文存储可能不是太友好。
总结
通过对MySQL字符集和排序规则的设置可以有效的解决中文编码问题,可以提高系统的兼容性以及扩展可用性。在实际使用的时候,我们可以根据自己的实际应用程序的情况来选择合适的方式来配置字符集和排序规则。
相关推荐
- 自学Python,写一个挨打的游戏代码来初识While循环
-
自学Python的第11天。旋转~跳跃~,我~闭着眼!学完循环,沐浴着while的光芒,闲来无事和同事一起扯皮,我说:“编程语言好神奇,一个小小的循环,竟然在生活中也可以找到原理和例子”,同事也...
- 常用的 Python 工具与资源,你知道几个?
-
最近几年你会发现,越来越多的人开始学习Python,工欲善其事必先利其器,今天纬软小编就跟大家分享一些常用的Python工具与资源,记得收藏哦!不然下次就找不到我了。1、PycharmPychar...
- 一张思维导图概括Python的基本语法, 一周的学习成果都在里面了
-
一周总结不知不觉已经自学Python一周的时间了,这一周,从认识Python到安装Python,再到基本语法和基本数据类型,对于小白的我来说无比艰辛的,充满坎坷。最主要的是每天学习时间有限。只...
- 三日速成python?打工人,小心钱包,别当韭菜
-
随着人工智能的热度越来越高,许多非计算机专业的同学们也都纷纷投入到学习编程的道路上来。而Python,作为一种相对比较容易上手的语言,也越来越受欢迎。网络上各类网课层出不穷,各式广告令人眼花缭乱。某些...
- Python自动化软件测试怎么学?路线和方法都在这里了
-
Python自动化测试是指使用Python编程语言和相关工具,对软件系统进行自动化测试的过程。学习Python自动化测试需要掌握以下技术:Python编程语言:学习Python自动化测试需要先掌握Py...
- Python从放弃到入门:公众号历史文章爬取为例谈快速学习技能
-
这篇文章不谈江流所专研的营销与运营,而聊一聊技能学习之路,聊一聊Python这门最简单的编程语言该如何学习,我完成的第一个Python项目,将任意公众号的所有历史文章导出成PDF电子书。或许我这个Py...
- 【黑客必会】python学习计划
-
阅读Python文档从Python官方网站上下载并阅读Python最新版本的文档(中文版),这是学习Python的最好方式。对于每个新概念和想法,请尝试运行一些代码片段,并检查生成的输出。这将帮助您更...
- 公布了!2025CDA考试安排
-
CDA数据分析师报考流程数据分析师是指在不同行业中专门从事行业数据搜集、整理、分析依据数据作出行业研究评估的专业人员CDA证书分为1-3级,中英文双证就业面广,含金量高!!?报考条件:满18...
- 一文搞懂全排列、组合、子集问题(经典回溯递归)
-
原创公众号:【bigsai】头条号:程序员bigsai前言Hello,大家好,我是bigsai,longtimenosee!在刷题和面试过程中,我们经常遇到一些排列组合类的问题,而全排列、组合...
- 「西法带你学算法」一次搞定前缀和
-
我花了几天时间,从力扣中精选了五道相同思想的题目,来帮助大家解套,如果觉得文章对你有用,记得点赞分享,让我看到你的认可,有动力继续做下去。467.环绕字符串中唯一的子字符串[1](中等)795.区...
- 平均数的5种方法,你用过几种方法?
-
平均数,看似很简单的东西,其实里面包含着很多学问。今天,分享5种经常会用到的平均数方法。1.算术平均法用到最多的莫过于算术平均法,考试平均分、平均工资等等,都是用到这个。=AVERAGE(B2:B11...
- 【干货收藏】如何最简单、通俗地理解决策树分类算法?
-
决策树(Decisiontree)是基于已知各种情况(特征取值)的基础上,通过构建树型决策结构来进行分析的一种方式,是常用的有监督的分类算法。决策树算法是机器学习中的一种经典算法,它通过一系列的规则...
- 面试必备:回溯算法详解
-
我们刷leetcode的时候,经常会遇到回溯算法类型题目。回溯算法是五大基本算法之一,一般大厂也喜欢问。今天跟大家一起来学习回溯算法的套路,文章如果有不正确的地方,欢迎大家指出哈,感谢感谢~什么是回溯...
- 「机器学习」决策树——ID3、C4.5、CART(非常详细)
-
决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。本文将分三篇介绍决策树,第一篇介绍基本树(包括ID3、C4.5、CART),第二篇介绍Ran...
- 大话AI算法: 决策树
-
所谓的决策树算法,通俗的说就是建立一个树形的结构,通过这个结构去一层一层的筛选判断问题是否好坏的算法。比如判断一个西瓜是否好瓜,有20条西瓜的样本提供给你,让你根据这20条(通过机器学习)建立起...
- 一周热门
- 最近发表
- 标签列表
-
- kubectlsetimage (56)
- mysqlinsertoverwrite (53)
- addcolumn (54)
- helmpackage (54)
- varchar最长多少 (61)
- 类型断言 (53)
- protoc安装 (56)
- jdk20安装教程 (60)
- rpm2cpio (52)
- 控制台打印 (63)
- 401unauthorized (51)
- vuexstore (68)
- druiddatasource (60)
- 企业微信开发文档 (51)
- rendertexture (51)
- speedphp (52)
- gitcommit-am (68)
- bashecho (64)
- str_to_date函数 (58)
- yum下载包及依赖到本地 (72)
- jstree中文api文档 (59)
- mvnw文件 (58)
- rancher安装 (63)
- nginx开机自启 (53)
- .netcore教程 (53)