基于 chinese-poetry 数据整理的一份 mysql 格式数据
#####唐宋诗数据表
create table poetry (
id int(11) not null primary key auto_increment,
author_id int(11) default 0,
title varchar(255) not null,
content text not null,
yunlv_rule text default null,
author varchar(255) not null,
dynasty char(1) not null
) engine = myisam, charset=utf8;
#####唐宋诗作者数据表
create table poetry_author (
id int(11) not null primary key auto_increment,
name varchar(255) not null,
intro text default null,
dynasty char(1) not null
) engine = myisam, charset=utf8;
#####宋词作者数据表
create table poems_author (
id int(11) not null primary key auto_increment,
name varchar(255) not null,
intro_l text default null,
intro_s text default null
) engine = myisam, charset=utf8;
#####宋词数据表
create table poems (
id int(11) not null primary key auto_increment,
author_id int(11) default 0,
title varchar(255) not null,
content text not null,
author varchar(255) not null
) engine = myisam, charset=utf8;
#####论语数据表
create table lunyu (
id int(11) not null primary key auto_increment,
chapter varchar(255) not null,
content text not null
) engine = myisam, charset=utf8;
#####诗经数据表
create table shijing (
id int(11) not null primary key auto_increment,
title varchar(255) not null,
chapter varchar(255) not null,
section varchar(255) not null,
content text not null
) engine = myisam, charset=utf8;
- poetry, poems, lunyu, shijing 表中 content 字段以及 poetry 表中的 yunlv_rule 字段中的值根据原始段落数据通过 "|" 分割成一个整行存储
- poetry, poems 表中的 author_id = 0 的数据行表明在对应数据的作者表中并没有找到对应的作者信息,故留空,而其 author 字段值来源于原始数据标注
本项目中提供的 sql 压缩包是使用这个脚本生成的,因此对于需要即时更新的使用者,可以使用该脚本手动生成一份最新的 sql 数据.步骤如下:
$poetryBasePath = "/data/opensource/chinese-poetry";
$poetryDataPath = $poetryBasePath."/json";
$poemsDataPath = $poetryBasePath."/ci";
$lunyuDataPath = $poetryBasePath."/lunyu";
$shijingDataPath = $poetryBasePath."/shijing";
- 修改以下代码,设置好数据库信息
$host = "127.0.0.1";
$port = 3306;
$username = "root";
$password = "1234";
$poetryDb = "poetry_new";
- 在命令行中执行
php mksql.php
- 我在导出 sql 压缩包时使用了 --default-character-set=utf8 选项,因此正常情况下按照以下步骤回放在数据库中不会出现乱码问题
- 登录 mysql 服务器,首先执行:set names utf8; 设定客户端编码
- 创建一个 database,并指定 charset=utf8;
- 在刚创建的 database 里执行 source /path/sql/poetry.sql 回放数据
- 去掉 poems, poems_author 表中的 dynasty 字段
- 新增论语,诗经数据
- 增加生成脚本
- sql 压缩包数据更新
- 修改 mksql.php 脚本,增加编码设置
- sql 压缩包数据更新
- 增加 sql 数据导出及回放步骤,解释部分人遇到的乱码问题