php mysql百万级数据去除重复数据

<?php教程
//定义一个数组,用于存放排重后的结果
$result = array();
//读取uid列表文件
$fp = fopen('test.txt', 'r');

while(!feof($fp))
{
$uid = fgets($fp);
$uid = trim($uid);
$uid = trim($uid, " ");
$uid = trim($uid, " ");

if($uid == '')
{
continue;
}
//以uid为key去看该值是否存在
if(empty($result[$uid]))
{
$result[$uid] = 1;
}
}

fclose($fp);

//将结果保存到文件
$content = '';
foreach($result as $k => $v)
{
$content .= $k." ";
}
$fp = fopen('result.txt', 'w');
fwrite($fp, $content);
fclose($fp);
?>  

<?php
//定义数组,用于存放排重后的结果
$result = array();
//读取第一个uid列表文件,放入$result_1
$fp = fopen('test_1.txt', 'r');
while(!feof($fp))
{
$uid = fgets($fp);
$uid = trim($uid);
$uid = trim($uid, " ");
$uid = trim($uid, " ");
if($uid == '')
{
continue;
}
//以uid为key写入$result,如有重复就会覆盖
$result[$uid] = 1;
}
fclose($fp);
//读取第二个uid列表文件,并进行排重操作
$fp = fopen('test_2.txt', 'r');
while(!feof($fp))
{
$uid = fgets($fp);
$uid = trim($uid);
$uid = trim($uid, " ");
$uid = trim($uid, " ");
if($uid == '')
{
continue;
}
//以uid为key去看该值是否存在
if(empty($result[$uid]))
{
$result[$uid] = 1;
}
}
fclose($fp);
//$result里保存的就排重以后的结果,可以输出到文件,代码省略
?>

时间: 2025-01-21 18:26:54

php mysql百万级数据去除重复数据的相关文章

MYSQL中GROUP分组去除重复数据

GROUP分组去除重复数据 /**  * 清除同一专题中重复导入的数据  * @author tanteng  * @date 2014.07.27  */ public function fuck_repeat(){  set_time_limit(0);  $sql = "SELECT `id` FROM `v95_special_content` GROUP BY `specialid`,`curl` HAVING COUNT(`curl`)>1 ";  $result =

mysql数据库去除重复数据

问题描述 mysql数据库去除重复数据 现在存在一个比赛信息 数据表(matchInfo),里面的字段有 id,MatchName,MatchTime,master,guest,现在是因为写入数据库的时候会出现重复数据,请问一下应该怎么过滤?sql语句怎么写? 解决方案 select distinct matchtime,matchname,master,guest from matchinfo 解决方案二: 通过分组查询可以简单的实现 select * from matchInfo group

java-Java导入excel文档,如何去除重复数据?

问题描述 Java导入excel文档,如何去除重复数据? 以下是我的导入excel工具类 public class StuExcelUtil { public static List<Student> redexcel(File file) throws Exception{ List<Student> list=new ArrayList<Student>(); InputStream input=new FileInputStream(file); Workbook

php+mysql百万级数据怎么排序

  php+mysql百万级数据如何排序? php+mysql百万级数据分页.因涉及多表多条件联合查询.谁能帮忙优化下面的查询语句. if(empty($wheresql)){ $wheresql="where aid>=(SELECT aid FROM `tj_logs` LIMIT $sqlfirst,1) limit $shownu"; }else{ $wheresql.=" and aid>=(SELECT aid FROM `tj_logs` LIMIT

sql 去除重复数据(多字段)

问题描述 sql 去除重复数据(多字段) 我现在有个表 表里面有ID No,Pass 然后根据No,Pass相同的数据,保留Max(ID)数据,删除其他,如何做? 我是这么做的,不知道行不行 delete Min(ID),CAST(No AS VARCHAR)+CAST(Pass AS VARCHAR) from Table group by No, Pass having count(*) > 1 解决方案 可以用distinct或者group by一下 解决方案二: 试一下 DELETE F

《Clojure数据分析秘笈》——2.4节识别并去除重复数据

2.4 识别并去除重复数据 清洗数据过程中的一个难题是如何处理重复值.如何找到它们?一旦找到了如何处理?尽管这个过程中的一些步骤是自动进行的,但整合它们通常需要手动完成,因为人们需要检查匹配到的潜在结果并确定它们是不是重复的和如何处理重复数据.当然,可以用启发式编程,但在特定时刻需要手动调用. 第一个需要回答的问题是数据的构成.如果数据有两个项,需要检查哪些域来判断是否存在重复?还有,相似程度多高的数据才可以算得上重复数据? 在本方法中,通过在命名域进行模糊匹配来检查一些数据,以判断是否存在重复

读取excel去除重复数据,然后在存入数据库

问题描述 读取excel去除重复数据,数据量比较大,考虑执行效率问题,求大神给出最好解决方案 解决方案 解决方案二:如果你没有技术讨论,那么请把帖子发到"项目外包"论坛.免费"求"人,是一点诚意也没有的.解决方案三:你好!你可以在先Excel里面去除重复,再数据导入!这种方法不行吗?解决方案四:在查询Excel的时候直接去掉不行吗?和在数据库中一样用distinct解决方案五:可用第三方dll读取excel数据后进行去重然后存放到数据库中.aspose.cells读

Angularjs的ng-repeat中去除重复数据的方法_AngularJS

本文实例讲述了Angularjs的ng-repeat中去除重复数据的方法.分享给大家供大家参考,具体如下: 一.JS: ngApp.filter('unique', function () { return function (collection, keyname) { var output = [], keys = []; angular.forEach(collection, function (item) { var key = item[keyname]; if (keys.index

sql如何去除重复数据

sql如何去除重复数据, 很多朋友一听就会想到DISTINCT ,那我们来看看distinct的用法吧. 下面来看看语法: SELECT DISTINCT column_name(s)FROM table_name 下面看个简单的例子: SELECT DISTINCT City FROM Persons   好了下面我们再来看看另一种方法用group by 来做吧,这个想法是从网上来的下面我们来看看下面的sql.   Select *,m_id from tbname group by m_id