logo

2022

MaxCompute (ODPS) 计算中的长尾问题
省下 700 万的数据治理方案总结
全链路数据血缘构建及方案

2021

SQL 入门指导片(2) - 条件筛选
SQL 入门指导片(1) - 基本操作
【杂谈】近况记录及思考写博客的目的

2020

出租房内「网络架构」设计与「智能家居」场景应用
基于 Spark Streaming 实时预测 Spark ML 模型
基于 Spark ML + Jieba + Jaccard 计算文本相似度
如何选择特征?熵与信息增益 Entropy & Information Gain
选择最有性价比的 YouTube Premium 订阅计划
A/B Testing 多实验分层重叠方案
Homebrew 指定版本安装 - Homebrew Install Specify Version
优化 MaxCompute SQL 的几个 Tips
Surge Mac 外部代理模式 - 使之支持 SSR/V2Ray
Spark Machine Learning 之集成 TensorFlow 模型并实现离线预测
对 BIO,NIO,AIO 三种模式的理解

2019

罗技 Logitech Unifying 优联模式在 macOS Catalina 10.15 版本下的 bug 及解决方案
macOS 安装启动生产消费 Apache Kafka
Spark Machine Learning 之 GBDT+LR 代码逻辑
基于阿里云 OSS & Loghub 实现博客流量分析
Apple TV 在中国大陆的最佳配置教程
给 Docker 镜像瘦身的几个 Tips
使用 Rentalcars / RentalCover 租车欧洲自驾出险全纪录

2018

如何在国内看 Netflix 及搭建优质线路
白本护照申请申根(意大利)签证
Spark 集成阿里云 MaxCompute 并装配 PMML 格式模型
Hadoop2.6 与 Spark1.5 的分布式集群部署流程
ShadowsocksR 使用方法及各平台下载地址
将中国区 Apple ID 转到美国区及绑定 PayPal
基于 pyspider 搭建分布式集群爬虫流程
基于 Hexo & Docker 的博客搭建流程
基于 pyenv 在 macOS 下管理多个 Python 版本