Wenlong Shen's Blog

不宠无惊过一生

搭建基于Docker的Tensorflow+Cuda环境

Walks

机器学习已是大数据分析的必备手段,我们尝试在Linux(Ubuntu 18.04)下搭建一个基于Docker的Tensorflow+Cuda环境,以用于学习、试验等。 关于Docker的安装和使用请参考我以前的博客内容。我们这里使用的是Tensorflow 1.12,使用前还需查看其对G...

Kaggle之路:Titanic

Titanic: Machine Learning from Disaster

Overview Titanic可谓是Kaggler的必经之路。我们以其为例,走一个完整的机器学习分析流程。 Step 1: 问题分析 关于Titanic的相关描述可参考官网,这是一个二分类的基本问题。 The sinking of the RMS Titanic is one of ...

父亲六十

A cycle of sixty years

六十甲子,生命循环往复 小学要读朱自清的《背影》,要背,要考中心思想,反复多遍也不解其味,而今大了,每每回想书中的场景,心中唯有苦涩。 中国式的父子关系少有拥抱,多是背影,或伟岸,或佝偻。父亲不表达,儿子不懂得。儿子长大变成父亲,又重复着同样的循环,自以为是的付出和无从下手的孝道。 寂寞...

Feature Importance

特征重要性

当我们训练完一个模型,得到理想的预测结果之后,或许我们还应该问问:哪个特征最为重要,它对模型有什么样的贡献? Permutation Importance Permutation的策略是考虑在模型训练完之后,将单个特征的数据值随机洗牌,破坏原有的对应关系后,再考察模型预测效果的变化情况...

深圳

安徒生插画展,沿海骑行

自由的城市,自由的灵魂 借着ICG-13,第二次来到深圳。一直对这个城市有好感,今日无会,正好完成沿海边骑行的愿望。 住在大梅沙,离市区实在太远,早上8点半出门,快11点才到南山区的海上世界文化艺术中心,有个国际安徒生奖插画家奖50周年的展览,很有意思,顺便给老婆买了个纪念品拼图。 12...

Kaggle Learn 学习笔记(5)

Data Visualisation

import pandas as pd df = pd.read_csv("...") Univariate plotting with pandas Bar chart可以方便地显示每个分类数据的数量、频率等。 df.value_counts().plot.bar() # re...

Kaggle Learn 学习笔记(4)

Deep Learning

Intro to Deep Learning and Computer Vision 对卷积神经网络的一个直观印象: Programming in TensorFlow and Keras 下面是一个卷积的例子: # Function to Read and Prep Image...