如何去除数据表中的重复数据

通常情况下，一个我们在做一个产品的时候，一开始可能由于设计考虑不周或者程序写的不够严谨，某个字段上的值产生重复了，但是又必须去掉，这个时候就稍微麻烦了一点，直接加一个UNIQUE KEY肯定是不行了，因为会报错。

现在，我们来采用一种变通的办法，不过可能会丢失一些数据 :)

在这里，我们设定一个表，其结构如下：

mysql> desc `user`; +-------+------------------+------+-----+---------+----------------+ | Field | Type　　　　　　 | Null | Key | Default | Extra　　　　　| +-------+------------------+------+-----+---------+----------------+ | id　　| int(10) unsigned | NO　 | PRI | NULL　　| auto_increment | | name　| char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　| | extra | char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　| +-------+------------------+------+-----+---------+----------------+

原来表中的数据假定有以下几条：

mysql> SELECT * FROM `user`; +----+-------+--------+ | id | name　| extra　| +----+-------+--------+ |　1 | user1 | user1　| |　2 | user2 | user2　| |　3 | user3 | user3　| |　4 | user4 | user4　| |　5 | user5 | user5　| |　6 | user3 | user6　| |　7 | user6 | user7　| |　8 | user2 | user8　| |　9 | USER2 | user9　| | 10 | USER6 | user10 | +----+-------+--------+

1、将原来的数据导出

mysql>SELECT * INTO OUTFILE '/tmp/user.txt' FROM `user`;

2、清空数据表

mysql>TRUNCATE TABLE `user`;

3、创建唯一索引，并且修改 `name` 字段的类型为BINARY CHAR区分大小写

mysql> ALTER TABLE `user` MODIFY `name` CHAR(10) BINARY NOT NULL DEFAULT ''; mysql> ALTER TABLE `user` ADD UNIQUE KEY ( `name` );

现在来看看新的表结构：

mysql> desc user; +-------+------------------+------+-----+---------+----------------+ | Field | Type　　　　　　 | Null | Key | Default | Extra　　　　　| +-------+------------------+------+-----+---------+----------------+ | id　　| int(10) unsigned | NO　 | PRI | NULL　　| auto_increment | | name　| char(10)　　　　 | NO　 | UNI |　　　　 |　　　　　　　　| | extra | char(10)　　　　 | NO　 |　　 |　　　　 |　　　　　　　　| +-------+------------------+------+-----+---------+----------------+

4、把数据导回去，在这里，有两种选择：新的重复记录替换旧的记录，只保留最新的记录或者是新的记录略过，只保留最旧的记录

mysql> LOAD DATA INFILE '/tmp/user.txt' REPLACE INTO TABLE `user`; Query OK, 10 rows affected (0.00 sec) Records: 8　Deleted: 2　Skipped: 0　Warnings: 0 mysql> SELECT * FROM USER; +----+-------+--------+ | id | name　| extra　| +----+-------+--------+ |　1 | user1 | user1　| |　8 | user2 | user8　| |　6 | user3 | user6　| |　4 | user4 | user4　| |　5 | user5 | user5　| |　7 | user6 | user7　| |　9 | USER2 | user9　| | 10 | USER6 | user10 | +----+-------+--------+

上面是采用REPLACE的方式，可以看到，导入过程中删掉了两条数据，结果验证确实是新的重复记录替换旧的记录，只保留最新的记录。

现在，来看看用IGNORE的方式：

mysql> LOAD DATA INFILE '/tmp/user.txt' IGNORE INTO TABLE `user`; Query OK, 6 rows affected (0.01 sec) Records: 8　Deleted: 0　Skipped: 2　Warnings: 0 mysql> SELECT * FROM USER; +----+-------+--------+ | id | name　| extra　| +----+-------+--------+ |　1 | user1 | user1　| |　2 | user2 | user2　| |　3 | user3 | user3　| |　4 | user4 | user4　| |　5 | user5 | user5　| |　7 | user6 | user7　| |　9 | USER2 | user9　| | 10 | USER6 | user10 | +----+-------+--------+

看到了吧，确实是新的记录略过，只保留最旧的记录。

时间： 2024-10-07 07:14:38

如何去除数据表中的重复数据的相关文章

MSSql简单查询出数据表中所有重复数据的方法_MsSql

本文实例讲述了MSSql简单查询出数据表中所有重复数据的方法.分享给大家供大家参考,具体如下: 这里直接给出下面的例子: SELECT * FROM SYS_LogContent slc WHERE slc.LogInfo_ID IN ( SELECT slc2.LogInfo_ID FROM SYS_LogContent slc2 GROUP BY slc2.LogInfo_ID HAVING COUNT(*)>1 ) 简单说明: 关键代码在于上面的括号中.要想查询出所有重复的数据,可以按照某

MSSql简单查询出数据表中所有重复数据的方法

本文实例讲述了MSSql简单查询出数据表中所有重复数据的方法.分享给大家供大家参考,具体如下: 这里直接给出下面的例子: SELECT * FROM SYS_LogContent slc WHERE slc.LogInfo_ID IN ( SELECT slc2.LogInfo_ID FROM SYS_LogContent slc2 GROUP BY slc2.LogInfo_ID HAVING COUNT(*)>1 ) 简单说明: 关键代码在于上面的括号中.要想查询出所有重复的数据,可以按照某

删除数据表中的重复记录

数据|重复|重复记录删除交通违章数据表中的重复记录(同一时间[haptime].车号牌[numberplate].处罚原因[reason])一.方法原理: 1.Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的, rowid确定了每条记录是在ORACLE中的哪一个数据文件.块.行上. 2.在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大rowid的就可以了,其余全部删除. 二.实现方法:1.查询重复记录select

怎样删除表中的重复数据，谢谢大家

问题描述怎样删除表中的重复数据,谢谢大家表内容如下: id fwbm kjbh sfxm dj yl ....................... 52578 d01142 d011422015928 001 .400 0 54.70 54.70 0 0 2015-09-28 00:00:00.000 NULL 52579 d01142 d011422015928 040 2.990 2 5.98 5.98 0 0 2015-09-28 00:00:00.000 NULL 52580 d0

MSSQL如何在没有主键的表中删除重复数据

原文:MSSQL如何在没有主键的表中删除重复数据为了对重复数据进行实验,下面建一个设计不太好(没有主键)表并插入了一些重复数据: create database testdb use testdb ; go create table DupsNoPK (Col1 int Null, Col2 char(5) Null ); go insert DupsNoPK(Col1,Col2) Values(1,'abc'), (2,'abc'), (2,'abc'), (2,'abc'), (7,'xy

Excel怎么在两个工作表中查找重复数据

2.现在我们的实例是从Sheet3工作表找出己经在Sheet4工作表中姓名相同的记录.因为我们现在在Sheet3工作表对应列中输入以下"=if(B2=" 如下图红框所示. 3.现在我们在excel中直接切换到Sheet4工作表中,然后如下图所示框选姓名区域,并按回车键. 4.现在再回到sheet3工作表后,补全公式"=if(B2=Sheet4!B2:B24,"是","否")"如下图所示. 5.然后将光标移动到单元格右下角,

mysql 数据表中查找重复记录_Mysql

复制代码代码如下: select user_name,count(*) as count from user_table group by user_name having count>1; 这个我在很早有发过一个asp下的ACCESS 的

在Excel中标记重复数据的方法

在Excel中,我们通常做的数据都密集着很多数字,要自己一个个的寻找重复的数据,肯定会懵掉的,那有什么比较好的方式可以找出Excel数据表中的重复数据吗?有的,来看看吧! 将下图的工作表的重复数据进行标记.如图所示: 数据表 1.首先打开excel2007工作表,用鼠标框选选中可能存在重复数据或记录的单元格区域.单击"开始"选项卡中的"条件格式"打开菜单,在"突出显示单元格规则"子菜单下选择"重复值",打开. 选择&quo

2005-如何在SQL数据表中如何剔除连续重复的记录，统计个数时只记做1条记录？

问题描述如何在SQL数据表中如何剔除连续重复的记录,统计个数时只记做1条记录? 各位大虾帮帮忙:如何剔除数据表中连续重复的记录记做1条记录?? 数据表如下,我想要取result=0的sn在各prodorderid下的个数( 注意:要剔除连续重复的数据,记做1条记录,但是不连续的重复的分别记为1条记录 ) create table test ( id int identity(1,1) primary key, sn varchar(50) not null, prodorderid int n

猜你喜欢

Photoshop日月穿梭之术－日景变黄昏

1.打开待编辑的图像. 2.复制该图层2份. 3.选择中间的图层应用"照片滤镜"(菜单"图像>调节>照片滤镜").使用"加温滤镜(85)& ...

从用户角度来看用户体验

前几天有一个想法,想写关于用户体验的一点想法,但是由于文笔的深度有限,实在写不出来,就想了一个法子,直接从博客上面来提现什么是用户体验,如何把握用户体验和提高用户体验.一开始写了一个"网络营 ...

直接插入排序简介

排序是计算机程序设计中一种重要的操作,它的功能是将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列. 我们之前所熟知的大概是冒泡排序,选择排序,但相对来说,这两种方法的效率不是太高, ...

Android开发入门（二）使用意图 2.7 使用Intent-Filter

我们已经知道,一个activity通过使用Intent对象调用另外一个activity.为了能让其他activity做出回应,还需要在AndroidManifest.xml中配置<intent ...

Oracle数据库碎片产生的原因及碎片整理

数据库碎片是影响数据库性能的一个大因素,应及时发现并整理碎片. 一. 碎片是如何产生的当创建一个数据库实例时,会分成称为表空间(tablespace)的多个逻辑段(segment),如系统(syst ...

迅雷9下载速度怎么设置限速?

迅雷9下载速度默认的情况下是全速下载的,不会进入限速下载.那在有些时候段希望速度下载在一个固定的下载速度之内.就需要通过限速下载来设置了. 迅雷9下载速度怎么设置限速? 1.迅雷9,安装完成后打开 ...

PS使用topaz滤镜为美女调出柔美紫色调

最终效果原图详细教程 1.打开照片,由于照片来源于网络,所以我们第一步需要把照片上的文字给OOXX掉,去除文字的方法有很多,修补工具,仿制图章,内容识别等,无论怎样,只要能达到去除文字效果即可.这 ...

省时省力还省钱！最好用的免费PS插件

截至2015年,Photoshop诞生已有25年.25年中,Photoshop对这个世界产生了非常大的影响.我们都知道Photoshop是最强大最好用的图像处理软件之一,而不少PS插件的存在更是能 ...

Win8启动时如何越过Metro界面直接进入桌面

Win8启动时越过Metro界面直接进入桌面的方法如下: 1.在桌面上点击鼠标右键,选择"新建",选择文本文档. 2.进入新建的文本文档,输入以下指令: [Shell] Com ...

如何将pdf转换成ppt文档？

如何将PDF文档转换成PPT?对于企业员工来说现在接触到的资料越来越多的都是PDF文件,有的人需要做培训视频有的人要做演讲等,都需要制作PPT幻灯片,怎么把PDF转换成PPT是个问题,如果PDF支 ...

WIN7 嵌入式系统安装教程 Windows Embedded Standard 2011 安装

轻松构建你的第一个 Windows Embedded Standard 2011 镜像. 通过本文你可以快速掌握如何使用Windows Embedded Standard 2011 CTP1 来构建一 ...

memcached安装和验证

1> libevent安装官网down: http://www.monkey.org 我的网盘down:http://pan.baidu.com/s/1qW8syZi [root@luozh ...

android-使用MultipartEntity图片上传

问题描述使用MultipartEntity图片上传使用MultipartEntity上传单张图片.用了下面的代码,但是图片没有上传,也没有任何错误提示. 我将所有的数据库都加载了. try { H ...

java-开了事务以后，插入大量数据还有必要用批量插入吗？

问题描述开了事务以后,插入大量数据还有必要用批量插入吗? 我用的是jdbcTemplate,但是我用了事务,我还有必要用批量更新方法吗? 事务不就是等所有插入语句执行完了再执行提交的吗?这个是不是就 ...

ajax spring-ajax方式提交表单，spring mvc的Controller中怎么不能返回视图

问题描述 ajax方式提交表单,spring mvc的Controller中怎么不能返回视图 ajax请求到springmvc的Controller后,请求成功后为什么不跳转到jsp?就是这句:ret ...

脚本-QTP中的apply&amp;quot;with&amp;quot; to script的快捷键没有用了，怎么办呀？

问题描述 QTP中的apply"with" to script的快捷键没有用了,怎么办呀? 在用QTP进行录制后,为了让脚本简化,一般都是用With End With来进行优化,可 ...

&amp;#9733;大脑的9大未解之谜

大脑的9大未解之谜 1.大脑为什么有时间的意识为什么人人都自带"生物闹钟",比如想要第二天早晨办的很紧急的事,清晨一起床就想起来了(当然,健忘者另当别论):等待的 ...

数据安全备份刻不容缓在线备份业务前景广阔

本文讲的是数据安全备份刻不容缓在线备份业务前景广阔,[IT168 资讯]现如今数据的重要性不言而喻,然而诸多数据存储方式却存在诸多风险,机密邮件.重要数据.私密文件甚至聊天记录,这些数据的丢失或损坏 ...

移动开发者如何不为“手抖点到广告了”掏钱

借我一双慧眼吧,这么多广告,太容易手抖,哪些点击是真的有效?移动设备用户常常手一抖,点到了广告,殊不知,用户的无心之举却令移动开发者付出惨重代价,让他们有苦难言.要想将这种损失降至最小程度,关键是开发 ...

西数携全线存储解决方案亮相2014 ISS

2014年4月16日全球知名硬盘厂商,存储行业的领导者西部数据(纳斯达克股票代码:WDC)作为英特尔经销商大会(ISS)常年合作伙伴,再次以白金级别.携内外置全线产品亮相2014 ISS大会.不断 ...

iOS开发UI篇—在UITableview的应用中使用动态单元格来完成app应用程序管理界面的搭建

一.实现效果说明:该示例在storyboard中使用动态单元格来完成. 二.实现 1.项目文件结构和plist文件 2.实现过程以及代码在tableview的属性选择器中选择动态单元格. 说明:在 ...

腾讯二次创业：马化腾向大企业病开刀目光转向布局

2012年4月10日下午4点,一封800字的邮件,立刻让腾讯所有2万名员工从轻快的工作环境中严肃起来. 邮件的作者是马化腾.该邮件以部分腾讯干部反映内部会议效率低下为切入点,大谈腾讯需要在今年即刻解决 ...

互联网用户发展态势年轻化网吧成重要传播场所

中介交易 SEO诊断淘宝客云主机技术大厅近日,中国互联网络信息中心(CNNIC)发布了<第23次中国互联网络发展状况统计报告>.报告显示,我国网民数达到2.98亿,中国互联网普及率 ...

PostgreSQL修炼之道：从小工到专家. 3.4　查询语句

3.4 查询语句 3.4.1 单表查询语句查询student表中所有数据的语句为: select no, student_name, age from student; 其中"SELECT ...

php 生成静态页面的办法与实现代码详细版_php实例

php中主要用到的就是要用到fread()和fwirte().而静态页面生成了之后,就会牵扯到修改的问题.这里可以用到正则匹配的方法来替换模版中改变的部位.不过此种方法太麻烦,值得推荐的方法是直接把原 ...

qiujie

问题描述 2014-7-2418:17:43org.apache.catalina.core.StandardContextfilterStart严重:Exceptionstartingfilters ...

《深入理解ElasticSearch》——3.4　准实时、提交、更新及事务日志

3.4 准实时.提交.更新及事务日志一个理想的搜索解决方案中,新索引的数据应该能立即搜索到.ElasticSearch给人的第一印象仿佛就是如此工作的,即使是在多服务器环境下,然而事实并非如此(至少 ...

高端访谈：超融合系统将支撑混合云

戴尔EMC融合平台部门的首席技术官表示说,企业客户将越来越多地将数据中心与机架式超融合基础架构相结合,以此作为混合云的基础. 市场调研机构IDC最新的融合基础设施市场分析证实了一大持续性的趋势:当前市 ...

SQL Server-聚焦INNER JOIN AND IN性能分析（十四）

原文:SQL Server-聚焦INNER JOIN AND IN性能分析(十四) 前言本节我们来讲讲联接综合知识,我们在大多教程或理论书上都在讲用哪好,哪个性能不如哪个的性能,但是真正讲到问题的实 ...

粉丝笑醒，HBO 哭死：黑客威胁泄露《权力的游戏》大结局（内附真假大结局）

8 月 21日,外媒报道称,跟 HBO 死扛到底的黑客威胁要泄露<权力的游戏>第七季第七集,也就是第七季大结局.黑客还特别"贴心"地温馨提示:亲,千万不要随便看网页哦, ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.027 s.