Jc Blog

艺无止境,诚惶诚恐

Scala: 合并两个Map

"scala中快速简洁地合并两个map"

“You are not in charge of the universe; you are in charge of yourself.” 应用场景   最近在一个项目中需要把Scala的两个Map合并,合并的时候会遇到相同的键和不同的键,对与相同的键,合并后的值是两个Map的值的和,对于只存在于一个Map中的键保留其值不变,对于下面两个map的合并 scala> va...

Spark Partitioner: PageRank

"通过PageRank演示Spark通信开销"

“A great talker is a great liar.” Spark数据分区   在Spark分布式程序中,通信的代价是很大的,因此控制数据分布一伙的最少的网络传输可以极大地提升整体性能。和单节点的程序需要为记录集合选择合适的数据结构一样,Spark程序可以通过控制RDD的分区方式来减少通信开销。分区并不是对所有应用都有好处的——比如,如果给定RDD只需要被扫描一次,我么...

Neural Networks

"神经网络入门学习随记"

“It is literally the case that learning language makes you smarter. ” 前言   最近开始接触神经网络,遂记下自己学习过程中遇到的问题和心得。 简单来说:人工神经网络是一种旨在模仿人脑结构及其功能的信息处理系统。 人工神经网络的整个发展过程,大致可以分为5个阶段: 形成时期,M-P模型 低谷时期,当时神...

Hello Github

"Hello World, Hello Blog"

“Yeah It’s on. ” 前言 Jc 的 Blog 就这么开通了。 跳过废话,直接看技术实现 2016 年, 总算有个地方可以好好写点东西了。 作为一个程序员, Blog 这种轮子要是挂在大众博客程序上就太没意思了。一是觉得大部分 Blog 服务都太丑,二是觉得不能随便定制不好玩。之前因为太懒没有折腾,结果就一直连个写 Blog 的地儿都没有。 正文 接...