spark输出log信息中怎么过滤INFO信息?

问题描述

我按照网上的方法在文件log4j.properties中配置#Seteverythingtobeloggedtotheconsolelog4j.rootCategory=WARN,consolelog4j.appender.console=org.apache.log4j.ConsoleAppender这样使用spark-shell,可以看到只有warn信息输出,很简洁。worker.Worker-1-lin-spark.outlin@lin-spark:/opt/data01/spark-1.3.0-bin-2.6.0-cdh5.4.0$bin/spark-shellSparkassemblyhasbeenbuiltwithHive,includingDatanucleusjarsonclasspath16/05/2110:56:52WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicableWelcometo______/__/__________//___\/_/_`/__/'_//___/.__/_,_/_//_/_version1.3.0/_/UsingScalaversion2.10.4(JavaHotSpot(TM)64-BitServerVM,Java1.8.0_05)Typeinexpressionstohavethemevaluated.Type:helpformoreinformation.16/05/2110:56:56WARNUtils:Yourhostname,lin-sparkresolvestoaloopbackaddress:127.0.1.1;using10.170.56.63instead(oninterfaceeth0)16/05/2110:56:56WARNUtils:SetSPARK_LOCAL_IPifyouneedtobindtoanotheraddressSparkcontextavailableassc.SQLcontextavailableassqlContext.但是使用IDEA写完代码后运行,依旧很多INFO,这是怎么回事,怎么处理?6/05/2110:57:52INFOMemoryStore:Blockbroadcast_52_piece0storedasbytesinmemory(estimatedsize2.0KB,free253.4MB)16/05/2110:57:52INFOBlockManagerInfo:Addedbroadcast_52_piece0inmemoryonlocalhost:56191(size:2.0KB,free:256.8MB)16/05/2110:57:52INFOBlockManagerMaster:Updatedinfoofblockbroadcast_52_piece016/05/2110:57:52INFOSparkContext:Createdbroadcast52frombroadcastatDAGScheduler.scala:83916/05/2110:57:52INFODAGScheduler:Submitting1missingtasksfromStage39(MapPartitionsRDD[98]atmapathomework3.scala:67)16/05/2110:57:52INFOTaskSchedulerImpl:Addingtaskset39.0with1tasks16/05/2110:57:52INFOTaskSetManager:Startingtask0.0instage39.0(TID654,localhost,PROCESS_LOCAL,1322bytes)16/05/2110:57:52INFOExecutor:Runningtask0.0instage39.0(TID654)16/05/2110:57:52INFOHadoopRDD:Inputsplit:file:/opt/data02/sparkApp/IndexSearch/IRdata/reut2-007_491:0+450316/05/2110:57:52INFOExecutor:Finishedtask0.0instage39.0(TID654).1845bytesresultsenttodriver16/05/2110:57:52INFOTaskSetManager:Finishedtask0.0instage39.0(TID654)in54msonlocalhost(1/1)16/05/2110:57:52INFOTaskSchedulerImpl:RemovedTaskSet39.0,whosetaskshaveallcompleted,frompool16/05/2110:57:52INFODAGScheduler:Stage39(firstathomework3.scala:68)finishedin0.054s16/05/2110:57:52INFODAGScheduler:Job29finished:firstathomework3.scala:68,took0.056794s

解决方案

解决方案二:
补充一下:完整的log4j.properties文件为:#Seteverythingtobeloggedtotheconsolelog4j.rootCategory=WARN,consolelog4j.appender.console=org.apache.log4j.ConsoleAppenderlog4j.appender.console.target=System.errlog4j.appender.console.layout=org.apache.log4j.PatternLayoutlog4j.appender.console.layout.ConversionPattern=%d{yy/MM/ddHH:mm:ss}%p%c{1}:%m%n#Settingstoquietthirdpartylogsthataretooverboselog4j.logger.org.eclipse.jetty=WARNlog4j.logger.org.eclipse.jetty.util.component.AbstractLifeCycle=ERRORlog4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFOlog4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO
解决方案三:
log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFOlog4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO这里直接改为log4j.logger.org.apache.spark=WARN见$SPARK_HOME/conf/log4j.log4j.properties没有就cplog4j.properties.templatelog4j.properties你那一大堆info输出都是spark的,其实不建议屏蔽。

时间: 2024-10-25 18:48:46

spark输出log信息中怎么过滤INFO信息?的相关文章

使用跟踪标记查看过滤统计信息是否被使用

原文:使用跟踪标记查看过滤统计信息是否被使用     在某些情况下,表中数据较多,且分布不均匀的时候,执行计划的估计行数往往会有很大偏差,因此SQL Server 2008引入了过滤统计信息,意味着只对表中的特定数据计算统计信息.那么在调优查询的过程中如何知道语句是否使用了过滤统计信息呢?SQL Server提供了一个隐藏的跟踪标记来支持这一过程.下面Demo可以展示如何使用该跟踪标记.       我们首先对AdventureWorks的SalesOrderDetail做一个简单的查询,代码如

android-为什么安卓真机调试时,logcat会不断输出信息,除了过滤外,能不能从源头上解决这个问题。

问题描述 为什么安卓真机调试时,logcat会不断输出信息,除了过滤外,能不能从源头上解决这个问题. 为什么安卓真机调试时,logcat会不断输出信息,除了过滤外,能不能从源头上解决这个问题. 解决方案 好像不能Logcat 是所有应用调试的输出,源头是其它应用或系统在调用它,你能限制这些源头吗? 解决方案二: 你能阻止自己App的log,你还能阻止别人的log? 解决方案三: log当然是要不断输出的啊 不然干嘛叫log呢?

为什么tomcat的catalina.log日志中,没有把控制台所有的信息都记录下来

问题描述 如题,控制台报错,打印出了异常信息,但是到logs目录下打开catalina.log文件查看却没有记录,这是什么原因而且以前我见过日志里出现过异常信息,是同一个tomcat,也是同样的环境,没有修改过配置 问题补充:引用 解决方案 我也碰到这样的问题了,由于项目中处理异常的代码比较多,且以前没有用log4j记录,如果修改的话基本上每一个java文件都要修改成log.error("",e)这样的方式才能记录,我采用了这样的方式来记录,虽然不太好,但是应该可以应付过去把tomca

将Linux下编译的warning警告信息输出到文件中[整理笔记]

Linux中,脚本语言环境中,即你用make xxx即其他一些普通linux命令,比如ls,find等,不同的数字,代表不同的含义: 数字 含义 标准叫法0 标准输入  stdin = standard input1 标准输出  stdout = standard output2 标准错误输出  stderr = standard error 而系统默认的stdin,stdout,stderr,都是屏幕,所以,当你执行命令,比如make,后,所输出的信息,都是可以在屏幕上看到的.所以,想要将对应

logcat不停输出,无法看清报错信息,使用过滤器可以过滤,但是来不及看就消失了

问题描述 logcat不停输出,无法看清报错信息,使用过滤器可以过滤,但是来不及看就消失了 安卓开发调试程序时即使不运行所写程序logcat窗口也是一直输出,运行程序时也一直在不停输出.添加过滤器后可以过滤出信息,但是来不及看就消失了.请问这种情况该怎么处理?谢谢!!!! 解决方案 可以看一下这篇文章:http://blog.csdn.net/chenchudongsg/article/details/24664387 解决方案二: 你可以选择哪些类型的信息需要输出的,在logcat右上侧有一个

Linux kernel 不输出log信息

/********************************************************************************* * Linux kernel 不输出log信息 * 说明: * 为了加快Kernel启动速度,可以通过quiet禁止log输出信息,加快开机启动速度. * * 2017-11-16 深圳 南山平山村 曾剑锋 ***************************************************************

android log机制——输出log【转】

转自:http://blog.csdn.net/tdstds/article/details/19084327 目录(?)[-] 在android Java code中输出log Logprintln_native方法 本地层代码Log输出   转自: http://my.oschina.net/wolfcs/blog/164624     Android log系统. 在android Java code中输出log android系统有4种类型.6个优先级的log,有一些常量用于标识这些信息

在*.cs或*.vb文件中加入版本跟踪信息

在csdn上看到一篇[如何在*.CS文件中加入版本跟踪信息?]的文章,觉得对项目的版本控制会有一些实际意义.但是由于文中图片的缺失,无从试验,具体效果也无从得知.后查阅作者文中提到的博客园的随笔,依博客园作者文中提到的一些操作一一试验,结果和网友们一样"我也没弄出来!".没有办法,只有试试搜索MSDN了,发现其中的一篇Enable Keyword Expansion文章,按文中的操作步骤一试果然奏效!现整理具体实现步骤分享给大家,希望对大家有所帮助!首先:运行Visual Source

SQL Server 2005中获取数据库文件大小信息

捕捉SQL Server 2005数据库大小的趋势,这是非常重要的,因为DBA们可以利用这些信息来规划未来的空间需求,问题的通知类型,并规划繁重负载的时间段.本文将介绍一种捕捉这一信息的简单的方法. SQL Server上的每个数据库都包含了关于数据库文件的大小的信息,连同其他一些相关信息.为了得到这个信息,我们需要一个方法来从单个数库中一次性检索出相关的数据. 有两个方法可以实现这个功能: sp_spaceused:这个系统存储过程将返回当前数据库中的表.索引视图或 SQL Server 20