用 RSS 这么多年,陆陆续续给自己的订阅列表增加,删除,更新了很多的订阅源,也有很多的订阅源陆陆续续的失效,也有很多的新博客陆陆续续的涌现,不过如今的 RSS 早已经不像当年,很多新站点甚至都不会再提供 RSS 输出。
之前偶然间看到过一篇关于 RSS 整理的文章,觉得定期检视一下自己的订阅,更新也好,删除也好,整理让这些订阅源继续存在的理由也好,或者分享给更多的人也好,都是一件不错的事情。
我的所有订阅源都从 Google Reader 迁移到了 InoReader,订阅列表好几百项就不单独一一例举,只是将我平时经常查阅的,我觉得非常值得关注的列举一下,也欢迎大家推荐高质量的订阅源。我的部分订阅已经整理成了 InoReader 的 Bundle,具体内容可以参考下方。
这一个分类是更新不频繁,但是只要更新质量有一定保证的源,我会刻意选择不让每天更新的数量有 999,所以这是一个经常清零的高质量源。
这个分类中是一些关注的个人博客输出,因为有些博客更新并不是那么频繁,所以这个分类下的未读数一直都不是很高,这个目录下我存放一些有必要关注(可能是内容,可能是标题),但是又不需要非常及时关注的内容,比如说技术博客,常用工具博客等等
这个分类建了很久了,知道我的人肯定知道我不用 weibo,也把很多国内的社交网站删的一干二净了,但是有些时候总是有些信息源只更新 weibo,比如有些同学的,比如有些资源号,所以没办法我只能用工具 把 Weibo 的内容转成 RSS 输出到 InoReader 以便于存档和及时关注。至于 Instagram 同样,因为不怎么常打开,所以反而 RSS 看起来比较舒服。
这个分类创建之后只有特殊需求的时候才会看一下,大部分情况下都只是做个参考,这个分类收录了一些更新 VPS 优惠活动的站点,每当我想要购买 VPS 的时候会从中搜索一下这个提供商,看看历史记录里面的评价好坏。
这个目录下是一些图书,Kindle 技巧,图书优惠的站点,本人看的也不是非常多,只是有需要的时候,一方面作为检索,另一方面作为备份。
这个目录放了一些推荐软件和应用专题的站点,很早再用 Windows 的时候关注了一批就顺手关注了,但是现在看的很少了。
这个目录有关注一些播客制作的博客,有一些混音的博客,很少看。
记录了商品的优惠价格,以作备份。
每日必读
Kindle 相关
软件及应用
又到一年的年末,和前几年 一样,总需要总结下今年,再畅想一下明年,前些年有些时候会用 Google Photos 来存书的封面,也会记录下书的名字,今年就直接用了豆瓣的豆列 来记录了。
相较于前两年对东野圭吾的狂热,今年刻意地减少了虚构文学的数量,一方面也是因为东野圭吾的小说已经看遍,再没有另外一个小说家能够如此吸引我。所以看今年的书单,除了《造彩虹的人》《白金数据》外,只有特德姜的《你一生的故事》等少数几本。
人文哲学或许是今年最大的改变,这都要从哈耶克的《通往奴役之路》开始,因为这本书听了一档人文通识解读的播客,自此之后看着一类的书籍再也不会感到无聊,再就是今年国内形势明显发生了改变,所以这一类的文学作品才又被重新认识。然后因为哈耶克所以又读 了哈耶克的《我为什么写作》,很多人认识哈耶克仅仅因为《通往奴役之路》然而这本杂文集却从另外一个维度让我认识了哈耶克,以及他的思想从何而来,甚至前几篇文章都可以作为自传来看,在别国维和的所见所闻至今让我印象深刻。
之后又看了 [[独裁者手册]] 这也是一本让我震惊的书,一本让我觉得每一个段落都值得摘抄的书,一本让我一读就停不下的书。不像有些书写得像学术论文,这本手册虽然也是两位教授的研究性报告,但却有条有理,甚至会让我觉得有些“八股”,抛出一个论点,辅以一些论证,每一章节,每一个观点都非常充分的表达了。
再到《人类简史》一本走到哪里都是放在畅销书架的大热门,而实话说,虽然一定程度上和作者的一些观点一致,但并没有让我觉得这本书的预见性。阅读这本书倒是让我学习了很多人类进化的历史过程。
最后还有一部不得不提的杂文集《野火集》,知道龙应台也已经好久,因为在看《大江大海 1949》的时候看到这本《野火集》就将其加到了待看列表,一本写在 1985 年的书,却预言了几十年后发生的事情,做坏事的方法不管在哪个年代都一样,也是非常值得推荐一读的。
今年最多的可能就是技术类书籍了,也一定程度上达成了之前几年定下的目标,在看这些书的过程中,我也学会了粗读和精读,有些书因为出版年份较久,而技术发展是出版物无法跟随的,但是有些书中的理念和核心观点是不会变化的,就像年初看的 Docker 虽然有些技术细节发生了很大的变化,但是 Docker 的内在机制是没有发生大的变化的,再到 Python ,虽然很多书基于 2.x 版本,但是其实原理是相通的。
就像我在一条豆瓣书评中说的那样,个人对传记类的书籍并不是很关心,想来也只在大学的时候读过金庸的传记,甚至连我最喜欢的 Verne,都没有特意去寻找他的传记,我觉得一个好的作家只需要在作品中表现自己即可,但是今年的一个契机,让我看了一些人物传记,这其中包括巴菲特,万达的王健林,再到腾讯传。看一个人物的成功历程,或许有些鸡汤,也能看出一些美化的痕迹,然而却都少不了这些人物之所以成功的理由,抛开那些勤奋,努力,天资,我看到的更多是这些人在那个时代超前的视野,对于时代变化的敏感,而这又离不开曾经的勤奋和努力。
这一个条目在 Trello 的代办事项中已经躺了快两周,期间一直在寻找合适的任务提醒 app 能够来帮助初期养成一定的习惯,没想到寻寻觅觅最后竟然又回到了 Google Calendar 的怀抱。
个人原来就有一习惯,对于需要长期规划的有固定时间的事情一般都会记录在 Google Calendar 中,比如周期性长时间的课程,或者一次性的旅程时间安排等等,而对于非周期性任务用 Trello 来管理,所以一直想要寻找一个能够周期性提醒,关键是要手机通知栏提醒,但是使用起来又比较方便(可以一键 mark as done,定制任务快捷)的应用,下面是我总结出来的一些此类习惯培养 app,我认为必须匹配的一些功能:
最开始的时候想用 Google Calendar 来定义周期性定时任务,这本来非常简单,但是 Google Calendar 在提醒的同时并不能 mark done,这就有些不便,并且对于短期,比如签到此类的任务总不能定义 5min 的任务吧。
其次又想到了日常天天在用的 Trello,然而 Trello 适合任务管理,对周期性任务支持也并不友好。
然后又在 iOS 上找到了番茄 todo,Tiny Routines,小目标,都非常精致,但都不是理想中的那么方便。并且这些 app 都参杂了太多的商业内容,虽然承认这些应用都很不错,但是也无形中增加了使用成本。
Google Calendar 中创建日程可能会发现如下三种类型
这三种类型在 Google Calendar 中的作用各不相同,通常情况下,使用创建按钮在标题下方可能会看见 Event 和 Reminder 选项
当时如果在周视图,或者月视图中,使用鼠标选择多天,那么在创建的对话框中会出现 Task 选项
但是需要注意的是 Task 只能够选择一天,而事件则能够选择一个时间范围。所以这里就要求我们来具体区分一下这三者的区别。
Event 事件是 Google Calendar 最重要的概念,事件是有发生的时间范围的,从创建事件的选择中就能看到,一个事件可以拥有如下的选项:
总体来说 Event 是 Calendar 的核心,如果是有固定发生时间的事情,那么用 Event 来组织是最好的,在 Google Calendar 中会在视图中以设定的颜色来显示在图中。
Reminder 提醒,提醒相较于 Event 就要简单很多,提醒只能够定义:
所以从他的涵盖范围就能够知道 Reminder 是用来在特定时间来提醒一件比较能够快速完成的事情的,理论上提醒的事情应该能够短则几分钟,长则十分钟就能够完成的事情。而新建 Reminder 也是最最简单的事情,甚至用语音 “reminder me to do something at some time” 就能快速建立的事情。Reminder 生成的内容可以标记 Done,在界面中就会显示为横线删除的样子,表示已做,非常清楚。
Task 是最让人混淆的事情,我个人习惯使用 Trello 来管理我的 Task,可以这么理解,Task 可以是还没有具体时间安排的任务。所以在日历中最上方全天安排点击的时候 Task 的选择才会出现。Task 能够设定的只有:
对于需要办但是却没有安排出具体时间来办的事情就可以使用 Task 来组织管理。Task 则更像一个 to-do list 管理工具,不过这个 to-do list 则会贯穿整个 Google 的产品线,在 Google Calendar 中创建的 Task 会在 Gmail 中出现
在 Google Calendar 的移动版,包括 Android 和 iOS 在点击加号之后可能会发现桌面版没有的一个选项,就是 Goal,目标,这个功能是我发现将 Google Calendar 提升一个境界的地方。在这个 Goal 中可以设定一个目标,比如看一本书,坚持一定时间的锻炼,再比如学习一个技能,包括但不限于语言啊,乐器啊等等,Google Calendar 默认给出了非常好看的一些模板,非常容易上手。在 Goal 中可以定义:
在制定这一系列方案之后 Google Calendar 会自动分析日程安排,将这个目标穿插在日程安排中,以给定的时间范围和频率定时提醒来完成目标。于是这个功能就可以当做习惯培养的绝好工具,不管做任何事情,指定一个目标让 Google Calendar 帮助你安排时间,简直太赞了。
更加重要的一点是,Goal 产生的每一次事件都能够标注是否 done,每一个事件打开都能够看到这个目标前几周的完成情况,以及是否 Mark 这一次 Done,这样就能够很好的督促自己的认真的完成每一次目标。
后来在寻觅的过程中突然发现了移动版的 Google Calendar 点开加号除了常规的 Event,竟然还有 Goal 和 Reminder 两个选项。
Reminder 很好理解,字面意思,提醒,不过 Google Calendar 更加智能的是可以周期性提醒,那这就完美的解决了培养习惯通常开始需要的提醒,并且跨平台,有通知,这就非常方便了。
而 Goal 则是制定一个目标,由 Google Calendar 来自动决定哪个时间段来帮助完成这个目标。
直接在 Chrome 的工具栏中访问 Google Calendar 中内容。
允许在浏览器中追踪花了具体多长时间,和 Calendar 结合就能具体看到做一件事情花费了多久。需要结合 Toggl 这个网站使用,所有的数据都会被导入到该网站。
通常来讲 RuntimeException 是在编码过程中可以被避免的 Exception ,比如说 NullPointerException
, ArrayIndexOutOfBoundException
等。如果每次都在调用前检查 null,就永远不会发生 NullPointerException
,ArrayIndexOutOfBoundException
同理。RuntimeException 不会被编译器检查。
Java 中有两种类型异常,一种是 checked exceptions,一种是 un-checked exceptions。检查的异常必须被显示的代码处理,un-checked exceptions 则不需要。任何一个从 Exception 派生的类都是 checked exception, 而从 RuntimeException 派生的则是 un-checked.
Exception 和 Error 都是继承自 Throwable,Throwable 则是继承 Object。而 RuntimeException 则是继承 Exception。
下面是一些常见的 RuntimeException
AnnotationTypeMismatchException,
ArithmeticException,
ArrayStoreException,
BufferOverflowException,
BufferUnderflowException,
CannotRedoException,
CannotUndoException,
ClassCastException,
CMMException,
ConcurrentModificationException,
DataBindingException,
DOMException,
EmptyStackException,
EnumConstantNotPresentException,
EventException,
IllegalArgumentException,
IllegalMonitorStateException,
IllegalPathStateException,
IllegalStateException,
ImagingOpException,
IncompleteAnnotationException,
IndexOutOfBoundsException,
JMRuntimeException,
LSException,
MalformedParameterizedTypeException,
MirroredTypeException,
MirroredTypesException,
MissingResourceException,
NegativeArraySizeException,
NoSuchElementException,
NoSuchMechanismException,
NullPointerException,
ProfileDataException,
ProviderException,
RasterFormatException,
RejectedExecutionException,
SecurityException,
SystemException,
TypeConstraintException,
TypeNotPresentException,
UndeclaredThrowableException,
UnknownAnnotationValueException,
UnknownElementException,
UnknownTypeException,
UnmodifiableSetException,
UnsupportedOperationException,
WebServiceException
自从年初注册了 PT 站 就发现原来的 QNAP TS453bmini 的硬盘就不堪重负,所以想要把下载和真正想要管理的数据安全的从硬件上隔离开,所以才有了这篇文章。
自行组装 NAS 相较于买成品 NAS 中间可能遇上许许多多坑,不过填坑的过程就是学习的过程,能学到很多硬件知识,并且通过对自己需求的合理规划能够组一台最合理的符合自己需求的机器。
下面就记录一下研究过程中新接触到的概念。
在看主板的时候不可避免的会看到这个 ITX,实际上 ITX 就是主板的一个大小,ITX 或者又称为 Mini-ITX 是一块 17 * 17cm 的主板,这种格式的主板是 2001 年时由 VIA Technologies 公司开发。ITX 主板通常被用在小型电脑中,比如一些嵌入式,无风扇,低功耗的机器中,比如[[家庭媒体中心]],或者家用服务器中,在很多人推荐的低功耗华擎 J3455 主板中,就有一款 J3455-itx 的主板。
市面上除了 ITX,还有如下几个常见的主板尺寸:
PCIe 或者是 PCI-e,又叫做 PCI Express 全称是,Peripheral Component Interconnect Express,PCIe 是一个高速串行计算机扩展总线标准,设计的目标是为了替换老的 PCI, PCI-X 和 AGP 总线标准。它是个人计算机主板的显卡,硬盘,SSD,Wi-Fi,网卡的连接接口。有了这个接口就多了一个扩展接口,比如通过 PCIe 接口转 SATA 接口可以扩容,可以通过 PCIe 接口来接外置显卡扩展显示能力,或者扩展以太网卡等等。
通常还会看到 PCIe x1, PCIe x4, PCIe x16 几个,要了解这些就需要知道 lane 的概念,lane 由两个不同的信号对组成,一个用来接收数据,一个用来发送数据。PCIe 的连线由不同的 lane 来连接,lane 组合可以提供更高的带宽。
A PCIe connection consists of one or more (up to sixteen, at the moment) data-transmission lanes, connected serially. Each lane consists of two pairs of wires, one for transmitting and one for receiving. There are 1, 4, 8 or 16 lanes in a single PCIe slot – denoted as x1, x4, x8, or x16.
PCIe 接口也经过了几个迭代,目前最常用的还是 PCIe 3.0.
系列 | Bandwidth | Giga transfer | Frequency |
---|---|---|---|
PCIe 1.0 | 8 GB/s | 2.5 GT/s | 2.5 GHz |
PCIe 2.0 | 16 GB/s | 5 GT/s | 5 GHz |
PCIe 3.0 | 32 GB/s | 8 GT/s | 8 GHz |
PCIe 4.0 | 64 GB/s | 16 GT/s | 16 GHz |
PCIe 5.0 | 128 GB/s | 32 GT/s | 32 GHz |
PCIe 6.0 | 256 GB/s | 64 GT/s | 32 GHz |
TDP,全称叫做 Thermal Design Power, 散热设计功耗,表示的是芯片达到最大负荷时热量释放的标准,单位是瓦特,是电脑冷却系统必须有能力驱散热量的最大限度,TDP 不是芯片释放热量的功率。
RAID 卡是一种把多块独立物理硬盘按照不同方式组合形成一个逻辑硬盘,从而提供比单碟更高性能和提供冗余资料的物理硬件。
RAID 卡是一种物理设备,但是组 RADI 还可以通过软件方式,称为软 RAID ,通过硬件完成 RAID 功能的叫做硬 RAID,通过软件使用 CPU 完成 RADI 的叫做软 RAID。一般不推荐使用软 RAID,出错和故障的概率较高。
如果想要了解更多 RAID 相关知识可以参考这篇文章。
在民用级别,目前市面上大都是千兆网卡,不过渐渐有人已经开始使用万兆网卡了。我个人觉得如果不是剪辑视频,或者需要在局域网中传输高码率的视频,目前个人是完全不需要使用到万兆网卡的。千兆网卡理论速度能到达 100 多M每秒,日常使用是完全没有问题的。
网卡 | 传输速率 | 理论峰值 | 备注 |
---|---|---|---|
百兆 | 100Mbps | 12.5MB/s | |
千兆 | 1000Mbps | 125MB/s | 超五类以上的网线 |
万兆 | 10000Mbps | 1250MB/s |
ECC memory 是 Error-correcting code memory 的缩写,这是一个可以校验并检查数据错误的内存。ECC 内存条一般用在不能忍受数据损坏的计算机中,比如科学计算或者金融领域。
塔式服务器外形和普通家用服务器相差不多,塔式主机在主板扩展上有优势,一般预留接口较多,方便扩展。适用于入门和工作站。
机架服务器的外观安装工业标准统一设计,需要配合机柜统一使用,主要用于企业服务器密集部署。机架服务器因为需要密集紧凑,所以在设计时会非常紧凑,充分利用有限的空间。机架服务器宽度 19 英寸,高度以 U 为单位 (1U=1.75 英寸 =44.45 毫米).
刀片服务器的主体结构是主体机箱中可以有许多热拔插的主板,每一块主板都可以独立运行自己的系统,这些主板可以集合成一个服务器集群,在集群模式下可以连接起来提供更好的网络以及共享资源。
在了解了这一系列的概念后就可以开始准备工作了,但首先需要了解配一台 NAS 的主要需求是什么,是作为媒体备份,是作为 Home Server,还是作为工作文件备份,还是作为下载机。
做好前期的评估,那接下来就是进行采购,NAS 必须的几个部分,包括 CPU,主板,内存,硬盘,机箱,这几部分最为重要,下面分开讲讲我是如何选择的。
在 CPU 选购方面,NAS 看中的是低功耗,我需要 NAS 长时间运行,而不需要 NAS 进行 CPU 密集型任务,所以对于 CPU 而言我并不追求性能,而如果其他人想要自己组一个 Home Server 就需要另外考虑了。
可能需要 CPU 的需求:
综上所述,我个人认为在我写这篇文章的时候(2020年)J3455 已经能满足我的需求。
在主板选购时需要注意主板上接口的数量,比如 SATA 接口的数量;有没有预留一些可以扩展的口比如 PCIe;如果想要连接电视或者投影,是否有 HDMI,或者 DP 口。
初步确定可选主板:
对于我个人而言,我希望至少有四个 SATA 口,这样我就可以买一个 4 盘位的 NAS 机箱,我还希望最好有一个 PCIe 扩展口,可以给未来留有一定的扩展空间,
综合性能和价格,J3455-ITX,自带 4 个 SATA,内存支持 DDR3/DDR3L 1866 SO-DIMM,也可以让我笔记本淘汰的内存条派上用场,留有一个 PCIe 2.0,看起来比较适合我。
J3455 自带 4 个 SATA 接口,J3455B 只有 2 个 SATA 口。
内存的选购也得看主板是否支持,上面提到了 ECC 内存,如果主板支持当然更好,不过大部分家用其实也不太需要上 ECC。
因为主板选择了 J3455-ITX,所以找一个便宜实用的低电压版的内存条即可。
机箱相较于 CPU 和主板,并没有那么主要,基本上也是跟着主板而选择。
综合外观和易用性考虑,我选择了迎广 MS04,外观看起开也不错。
不同的主板,机箱对电源大小和功率有一定的要求。
不同型号的电源上经常能看到一个额定功率,这里的额定功率指的是电源能提供的最大功率,单位是瓦特 (W). 对于低功耗的 J3455 主板,使用 200~300W 左右的电源即可。
在关于电源的选购上经常会听到 1U 或者 FLEX 电源这种说法,其实这里的 1U 和 FLEX 指的是电源的型号,有各自的规格:
1U 电源通常有更高的额定功率;因为 1U 通常是给机架服务器 (rack server) 设计,所以通常缺乏 PCIe 6/8 接口;因为在服务器领域,1U 电源通常设计为一直全功率运行,噪声可能是一个问题。而 FLEX 电源是从 1U 电源进化而来,通常设计为根据负载来调整风扇运行的速度,噪声影响可能稍微小一些。1
我对于网卡要求不高,毕竟家里千兆差不多了,也不是不够用。不过看到有人提到一块拆机万兆网卡 Mellanox 淘宝只要¥190,听起来还不错。
不过我个人并没有上万兆网卡,等未来需要再说吧。
之前整理过 几个 NAS 系统,FreeNas 需要硬件,而 unRAID, ESXi 都是闭源产品,且需要授权,先不论其强大的功能,对我而言 OpenMediaVault 比较合适,基于 Debian,我一直用 Mint 所以也比较熟悉。
所以最终的方案是在物理机的 SSD 上安装 Proxmox VE,然后在其中安装 OpenMediaVault,四块机械硬盘直通给 OpenMediaVault 然后使用 [[SnapRAID]] 和 [[MergerFS]] 组成一个存储池使用。
我的搭配方案:
总价格在 1500 元,另外再加硬盘的价格。
其他可选的机箱还有无牌的 ITX4 盘位机箱加一个航嘉电源,558。2
什么值得买的分享 3
chriscn 的配置 4
v2ex 的留言 5:
不算硬盘的话整体下来 2000 左右(半年前的价格),比群辉性能高,还便宜,要是喜欢群辉也可以装黑群晖,CPU 是 x86 架构的跑软件没有兼容问题。5
这是一个来自知乎 的文章:
当然如果追求极致性能,可以像这位大神一样配置:6
jq 是一个命令行下的 JSON 字符串处理工具,就像 sed 对于文本一样,jq 对应着 json 文件,jq 命令可以不同方式转换 JSON。jq 可以接受文本输入,默认情况下,jq 从 stdin 读取 JSON 流。通过和管道的组合可以非常方便的处理 JSON。
jq is a lightweight and flexible command-line JSON processor
js -I '.' input.json
cat input.json | jq -I '.'
jq 只能接受标准 JSON 格式,输入的文件内容必须严格遵守 JSON 格式标准。所以的属性名必须是双引号字符串。
jq 命令,原文格式化输出:
echo '{ "foo": "lorem", "bar": "ipsum" }' | jq .
cat input.json | jq .
如果有一个纯文本的大 JSON,比如好几 M 的文件,那么通过 GUI 去压缩显然不合理,通过命令非常快
jq -c . input.json
比如上面的字符串
{ "foo": "lorem", "bar": "ipsum" }
那么如果
cat input.json | jq '.foo'
则输出的就是 foo 为 key 的值
"lorem"
如果 key 不存在则返回 null
key 的书写方式支持 .key.key
级联的访问。
在线练习场
日志文件中的敏感信息比如密码,电话号码等等进行过滤处理。第一个想到的方法就是去 log4j 中自定义 Appender,在 Appender 中正则匹配敏感信息进行过滤。
log4j 日志框架在之前 的文章中也也说过,主要有三个组件,Logger,Appenders 和 Layout,要过滤日志内容解决方法也就是从这三个地方着手。
Logger 着手就是在打日志的时候就处理,从根源解决。最精确的处理就是在每个类敏感的字段上手动处理,在打印日志时,封装方法手动转换 String 。这种方法唯一的缺点就是对于一个大型成熟的系统,要修改的日志打印地方太多,更本无法顾及。所以还需要寻找统一的方法。
如果从根源上没有解决,接下来就是在 Appender 中,Appender 决定了日志往哪里输出,那么这个时候就可以重写 subAppend 方法重新修改 LogEvent 来修改日志信息,将敏感的内容移除。比如
import org.apache.log4j.DailyRollingFileAppender;
import org.apache.log4j.spi.LoggingEvent;
public class DesensitizeDailyRollingFileAppender extends DailyRollingFileAppender {
@Override
protected void subAppend(LoggingEvent event) {
String message = (String) event.getMessage();
// do your stuff
LoggingEvent modifiedEvent = new LoggingEvent(event.getFQNOfLoggerClass(), event.getLogger(), event.getTimeStamp(), event.getLevel(), modifiedMessage,
event.getThreadName(), event.getThrowableInformation(), event.getNDC(), event.getLocationInformation(),
event.getProperties());
super.subAppend(event);
}
}
最后,如果自定义 Appender 的话,那么每一个日志删除的目的 Appender 都要手动实现一下,这个时候如果复写 PatternLayout 就可以让多个 Appender 来使用。
定义自己的 PatternLayout ,然后在配置文件 Appender 指定用我们自己的实现的 PatternLayout。
import java.lang.reflect.Field;
import org.apache.log4j.PatternLayout;
import org.apache.log4j.spi.LoggingEvent;
public class DesensitizeLayout extends PatternLayout {
@Override
public String format(LoggingEvent event) {
if (event.getMessage() != null && event.getMessage() instanceof String) {
String message = event.getMessage().toString();
// do your stuff to change message
try {
Field msgField = LoggingEvent.class.getDeclaredField("message");
msgField.setAccessible(true);
msgField.set(event, message);
} catch (NoSuchFieldException | IllegalAccessException e) {
e.printStackTrace();
}
}
return super.format(event);
}
}
如果使用的是 log4j 2.x 版本,也可以使用这种方法重写 RewritePolicy,然后 Override rewrite 方法。
通过自定 Appender 或者 PatternLayout 可以实现敏感信息的脱敏,那么其实扩展可以实现其他的同类业务。比如固定格式输出,比如打印日志到内部日志收集器等等。
log4j 下的 PatternLayout 只是 Layout 的一种,用来格式化日志文件的输出。在 PatternLayout 中,配置一个样板字符串,通过该字符串来定义输出格式。
log4j 还提供了其他三种 Layout
这个类的目标是格式化 LoggingEvent 输出结果,这个结果依赖 conversion pattern
.
conversion pattern 和 C 语言下面的 printf 方法非常类似。conversion patter 由逐字文本和格式化控制表达式(conversion specifiers) 组成。
每一个 conversion specifiers 都由一个 %
开始,紧跟着一个可选的 format modifiers (被称为 conversion character)。conversion character 指定了类型,比如日期,线程名。format modifiers z 则控制字段宽度,padding,左右调整。
比如 %-5p [%t]: %m%n
配置
root.debug("Message 1");
root.warn("Message 2");
则会输出
DEBUG [main]: Message 1
WARN [main]: Message 2
ConversionPattern 参数的格式含义
格式名的含义:
%c 输出日志信息所属的类的全名
%C 调用 logger 的类的全名(包含包路径)
%d 输出日志时间点的日期或时间,默认格式为 ISO8601,也可以在其后指定格式,比如:%d{yyy-MM-dd HH:mm:ss },输出类似:2002-10-18- 22:10:28
%f 输出调用 logger 所属的类的类名
%l 输出日志事件的发生位置,类,线程,代码行数
%L 调用 logger 的代码行
%m 输出代码中指定的信息,如 log(message) 中的 message
%M 调用 logger 的方法名
%n 输出当前平台的换行符,Windows 平台为“\r\n”,Unix 平台为“\n”
%p 输出日志的优先级,即 DEBUG,INFO,WARN,ERROR,FATAL。如果是调用 debug() 输出的,则为 DEBUG,依此类推
%r 输出自应用启动到输出该日志信息所耗费的毫秒数
%t 输出产生该日志事件的线程名
Unix 内核在硬件之上,与硬件交互,系统文件读写,网络数据发送,内存分配,扬声器播放音频等等。程序不能直接访问内核,通信通过系统调用完成。
系统调用是内核和用户空间交互的桥梁,规定了程序和计算机硬件之间可以发生的交互。
Unix 的系统调用文档已经在系统中,输入 man man 查看。
进程是 Unix 系统基石,所有的代码都在进程中被执行。
唯一进程标示 PID,PID 本身没有任何进程信息,只是一个数字。系统中每一个进程都有其父进程,PPID。多数情况下,特定进程的父进程就是调用他的进程。
文件描述符值用来跟踪打开的资源,已经关闭的资源没有文件描述符。
每个 Unix 进程都有三个打开的资源,STDIN,STDOUT,STDERR。
每个进程打开的资源数量都是限制的,进程资源限制中,分为 soft limit 和 hard limit. soft limit 指的是内核所能支持的资源上限,hard limit 是 soft limit 的上限,当设置 hard limit 之后 soft limit 只能小于 hard limit.
可以使用 ulimit -a
来查看资源限制情况。
所有进程都从父进程继承环境变量。
C 库函数 setenv()
和 getenv()
所有进程都可以访问 ARGV 的特殊数组,argv 是 argument vector 缩写,参数向量
forking 是 Unix 编程中最强大的概念,fork 系统调用允许运行中的进程以编程的形式创建新的进程,这个新进程和原始进程一样。
在 forking 时,调用 fork 的进程被称为“父进程”,而新创建的进程被称为“子进程”。
forking 时会创建一样的新进程,所以 fork 尽管很快,但是会有一些问题,比如如果内存占用比较大,fork 多份之后可能内存被撑爆。
现代 Unix 采用写时复制(copy-on-write, CoW) 方法来克服这个问题,将实际内存复制操作推迟到真正写入的时候,父进程和子进程实际共享内存数据,直到其中一个需要对数据进行修改,才复制。
当 fork 多个并发子进程时,进程看管这些子进程,确保能够保持响应,对子进程的退出做出回应。
信号 | 值 | 动作 | 说明 |
---|---|---|---|
SIGHUP | 1 | Exit | Hangup |
SIGINT | 2 | Exit | Interrupt |
SIGQUIT | 3 | Core | Quit |
SIGILL | 4 | Core | Illegal Instruction |
SIGTRAP | 5 | Core | Trace/Breakpoint Trap |
SIGABRT | 6 | Core | Abort |
SIGEMT | 7 | Core | Emulation Trap |
SIGFPE | 8 | Core | Arithmetic Exception |
SIGKILL | 9 | Exit | Killed |
SIGBUS | 10 | Core | Bus Error |
SIGSEGV | 11 | Core | Segmentation Fault |
SIGSYS | 12 | Core | Bad System Call |
SIGPIPE | 13 | Exit | Broken Pipe |
SIGALRM | 14 | Exit | Alarm Clock |
SIGTERM | 15 | Exit | Terminated |
SIGUSR1 | 16 | Exit | User Signal 1 |
SIGUSR2 | 17 | Exit | User Signal 2 |
SIGCHLD | 18 | Ignore | Child Status |
SIGPWR | 19 | Ignore | Power Fail/Restart |
SIGWINCH | 20 | Ignore | Window Size Change |
SIGURG | 21 | Ignore | Urgent Socket Condition |
SIGPOLL | 22 | Ignore | Socket I/O Possible |
SIGSTOP | 23 | Stop | Stopped (signal) |
SIGTSTP | 24 | Stop | Stopped (user) |
SIGCONT | 25 | Ignore | Continued |
SIGTTIN | 26 | Stop | Stopped (tty input) |
SIGTTOU | 27 | Stop | Stopped (tty output) |
SIGVTALRM | 28 | Exit | Virtual Timer Expired |
SIGPROF | 29 | Exit | Profiling Timer Expired |
SIGXCPU | 30 | Core | CPU time limit exceeded |
SIGXFSZ | 31 | Core | File size limit exceeded |
SIGWAITING | 32 | Ignore | All LWPs blocked |
SIGLWP | 33 | Ignore | Virtual Interprocessor Interrupt for Threads Library |
SIGAIO | 34 | Ignore | Asynchronous I/O |
进程可以在任何时候收到信号,常见的用法在 shell 中使用 kill 发送信号。在时间中,信号多由长期运行的进程使用,例如服务器和守护进程。
管道是一个单向数据流,管道也是一种资源,有自己的文件描述符和其他一切,也可以和子进程共享。“流”数据没有开始和结束的概念,需要通过分隔符来确定。
Unix 套接字是一种只能用于同一台物理主机中进行通信的套接字,比 TCP 套接字快,适合用于 IPC。
管道提供的是单向通信,而套接字提供双向通信。
如果要从单机扩展到多台机器,可以使用 TCP 套接字,或者 RPC,远程过程调用等来实现。
在后台运行,不受终端用户控制。init 进程是所有进程的父进程。
这本书能简单的了解下 Unix 下进程的一些知识,包括系统调用,资源限制,资源竞争,信号,进程通信等等内容,但内容都稍微有点浅,并且作者用了 Ruby,虽然不影响阅读,总有些隔阂。
Appender 表示日志输出的地方,常见的有控制台,文件等等,log4j 自带了一些常用的 Appender。
log4j 框架中有两个概念 logger 和 appender。如果 logger 的最低 level 设置为 warn,这意味着任何日志 level 低于 warn 的日志都会被忽略。
一旦一个消息被 logger 接收,这条消息会被发送给一个或者多个 appenders(to console,to file,to mail server, etc). 每一个 appender 都会定义 threshold。比如可以限制打印到 console 的消息为 error,但是打印到文件的日志接收 warn 及以上。1
可能是最常见的一个 Appender,输出到控制台,ConsoleAppender 将日志事件输出到 System.out 或者 System.err 中。
<appender name="console-appender" class="org.apache.log4j.ConsoleAppender">
<layout class="org.apache.log4j.PatternLayout">
<param name="ConversionPattern"
value="%d{yyyy-MM-dd HH:mm:ss} %-5p %c{1}:%L - %m%n" />
</layout>
</appender>
AsyncAppender 允许用户异步(asynchronously) 地打印日志,AsyncAppender 会收集所有发送到它的事件,并将它们分发到所有附加在它的 appenders 中。可以在 AsyncAppender 上附属多个 appenders。
AsyncAppender 会使用单独的线程来处理它缓冲区中的事件。
Important note: The AsyncAppender can only be script configured using the DOMConfigurator.
将日志 event 输出到文件,直接子类有 DailyRollingFileAppender,和 RollingFileAppender。
可选的 append 配置表示是否在原来的文件内容上追加日志,如果是 false,log4j 会清理文件内容,每次重启程序,原来的日志文件会丢失,默认为 true,日志文件会越来越大。
RollingFileAppender 继承自 FileAppender 用来配置当日志文件到达一定大小则自动备份日志文件到其他地方。
两个参数 maxFileSize 和 maxBackupIndex
<appender name="file" class="org.apache.log4j.RollingFileAppender">
<param name="append" value="false"/>
<param name="maxFileSize" value="10KB"/>
<param name="maxBackupIndex" value="5"/>
<param name="file" value="/tmp/jutils/jutils.log"/>
<layout class="org.apache.log4j.PatternLayout">
<param name="ConversionPattern"
value="%d{yyyy-MM-dd HH:mm:ss} %-5p %c{1}:%L - %m%n"/>
</layout>
</appender>
DailyRollingFileAppender 继承自 FileAppender,定义的日志文件在用户指定的频率下会定时产生新的日志文件。
日志周期由 DatePattern 选项定义,模式需要遵循 SimpleDateFormat 格式,此处定义的日期格式会作为滚动日志文件的后缀。
举例,如果 File 选项设置为 /foo/bar.log
并且 DatePattern 设置为 “’.’yyyy-MM-dd”,那么在 2001-02-16 的午夜,日志文件 /foo/bar.log
文件会被拷贝到 /foo/ba.log.2001-02-16
,然后在 /foo/bar.log
日志文件中会继续记录 2001-02-17 的日志。
<appender name="dailyRolling" class="org.apache.log4j.DailyRollingFileAppender">
<param name="File" value="/tmp/jutils/roll_jutils.log"/>
<param name="DatePattern" value=".yyyyMMdd"/>
<param name="threshold" value="error"/>
<layout class="org.apache.log4j.PatternLayout">
<param name="ConversionPattern" value="%d{ISO8601} %-5p [%t] [%l] - %m%n"/>
</layout>
</appender>
DailyRollingFileAppender 同样支持指定按照月,星期,半天,天,小时,分钟间隔的分割配置。
DatePattern | Rollover schedule | Example |
---|---|---|
’.’yyyy-MM | 每月初 | |
’.’yyyy-ww | 每个星期第一天,每星期第一天由地区决定 | |
’.’yyyy-MM-dd | 每天 midnight | |
’.’yyyy-MM-dd-a | 每天 midnight 和 midday | |
’.’yyyy-MM-dd-HH | 每个小时 | |
’.’yyyy-MM-dd-HH-mm | 每分钟开始时 |
不要在 DatePattern 选项中使用冒号 :
.
自定义 Appender 以实现在记录日志时将其中部分信息过滤。
import org.apache.log4j.DailyRollingFileAppender;
import org.apache.log4j.spi.LoggingEvent;
public class SensitiveDailyRollingFileAppender extends DailyRollingFileAppender {
@Override
protected void subAppend(LoggingEvent event) {
String message = (String) event.getMessage();
String modifiedMessage = SensitiveUtils.filterName(message);
modifiedMessage = SensitiveUtils.filterName(modifiedMessage);
modifiedMessage = SensitiveUtils.filterIdentityId(modifiedMessage);
LoggingEvent modifiedEvent = new LoggingEvent(event.getFQNOfLoggerClass(), event.getLogger(), event.getTimeStamp(), event.getLevel(), modifiedMessage,
event.getThreadName(), event.getThrowableInformation(), event.getNDC(), event.getLocationInformation(),
event.getProperties());
super.subAppend(event);
}
}
如果想要更加基础可以继承 AppenderSkeletion,需要实现三个方法
复写 append 方法实现自己的内容。
https://stackoverflow.com/a/5120069/1820217 ↩