首先说明一下,我以前使用PERL,保存文件 用DBM数据库,有5万多条记录,每条记录有15个字段。现在想用MYSQL,要吧记录导过来。
第一步,将所有的DBM记录导入到了一个文本文件,每个字段之间用TAB分开(就是"t"),每条记录换行结束。
第二部,将数据读入数组,并且打开数据库和定义预处理如下:
代码如下 | 复制代码 |
<?php $dbline=file("g:/allrecord.txt"); //将数据库记录读入到数组 $collen=array(8,50,80,20,20,30,3,20,1,1,20,35,35,35,2); #表里面每个字段的长度数值 $db=new mysqli('localhost','me','mypass','allrecdb'); $q="INSERT INTO customers VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)"; $s=$db->prepare($q); #预定义插入记录 // |
数据库有15个字段,为了方便导入,已经设定全部类型为CHAR,长度从1到100不等,具体等同$collen的数值;
并且没有任何字段设置UNIQUE或者PRIMARY KEY;
在命令行用INSERT命令插入记录成功
//
代码如下 | 复制代码 |
foreach($dbline as $line) { $rec=explode("t",trim($line)); //这里反复测试过,$rec数组有15个值,并且我都把它strval了 // for($j=0;$j<count($rec);$j++) { $rec[$j]=substr($rec[$j],0,$collen[$j]); } for($i=0;$i<count($rec);$i++) { $rec[$i]=strval($rec[$i]); } $s->bind_param("sssssssssssssss",$rec[0],$rec[1],$rec[2],$rec[3],$rec[4],$rec[5],$rec[6],$rec[7],$rec[8],$rec[9],$rec[10],$rec[11],$rec[12],$rec[13],$rec[14]); $s->execute(); } $s->close(); $db->close(); ?> |
经过几个小时的调试,发现任何字串超过字段长度就不能添加,所以做了如下处理。
1) 先把每个记录的每个字段的长度进行了处理,代码如下:
代码如下 | 复制代码 |
for($j=0;$j<count($rec);$j++) { $rec[$j]=substr($rec[$j],0,$collen[$j]); } |
2)再处理插入
代码如下 | 复制代码 |
$s->bind_param("sssssssssssssss",$rec[0],$rec[1],$rec[2],$rec[3],$rec[4],$rec[5],$rec[6],$rec[7],$rec[8],$rec[9],$rec[10],$rec[11],$rec[12],$rec[13],$rec[14]); |
$s->execute();
这样就可以插入记录了。
目前剩下的问题是,任何带有汉字的记录,都不能插入(在命令行可以)。
查了资料,在命令行alter database crm character set 'gb2312',在脚本查询前加入$db->query("SET names 'gb2312'")
都没用。
也没找到my.ini去改default-character-set=gb2312
难道php5.5暂时不支持中文?
MYSQL太多稀奇古怪的提示,解决不了问题,所有装上了SQLITE,在命令行导入文本记录,发现了问题:
1)某些字段中存在换行符,但是在任何文本编译器中不换行或者不显示。这样会在导入的时候,1行变成2行,列参数自然不对了。
解决方案: 用str_replace($line,char(13));把每行内的换行符替换掉,然后把所有记录存入tmp.txt
2)再进行命令行的导入
代码如下 | 复制代码 |
sqlite3>.import tmp.txt customers sqlite3>select count(*) from cusomers; |
57491
显示导入成功。
可见,批量导入的时候,一定要处理好那些隐藏的特殊字符。
由于时间关系,没有测试MYSQL的情况。晚上有空再确认一下同样方案是否可行。