Tag Archives: python

Python Resource

 Python语言:

1、Python Language Essentials  《Python for Data Analysis》

2、廖雪峰python教程

Python函数式编程:从入门到走火入魔

Python工具及环境:

IPython Notebook: 交互计算新时代

Anaconda Scientific Python Distribution

WinPython

库与框架:

Beautiful Soup 4.2.0 文档

10 Minutes to pandas

数据分析:

零基础学习Python数据分析

Book:

Python基础教程

利用Python进行数据分析

集体智慧编程 (豆瓣)

这是一本非常好的入门书,书中的例子源码都是Python实现的,并且能帮你迅速熟悉Python相关的各种计算库

统计学习方法 (豆瓣)

这本书深入浅出地讲了和机器学习有关的一切数学基础知识,一整本的干货,没有废话,非常值得一读

Some Online Resources:

http://docs.python.org/tut/tut.html – Beginners

http://diveintopython3.ep.io/ – Intermediate

http://www.pythonchallenge.com/ – Expert Skills

http://docs.python.org/ – collection of all knowledge

Some more:

A Byte of Python.

Python 2.5 Quick Reference

Python Side bar

A Nice blog for beginners

Think Python: An Introduction to Software Design

Python Resource

优秀Python学习资源收集汇总(强烈推荐)

学习Python编程的11个资源

Hidden features of Python

怎么用最短时间高效而踏实地学习 Python

refer:http://stackoverflow.com/questions/70577/best-online-resource-to-learn-python

Open Sourcing a Python Project the Right Way

Most Python developers have written at least one tool, script, library or framework that others would find useful. My goal in this article is to make the process of open-sourcing existing Python code as clear and painless as possible. And I don’t simply mean, “create GitHub repo, git push, post on Reddit, and call it a day.” By the end of this article, you’ll be able to take an existing code base and transform it into an open source project that encourages both use and contribution.

While every project is different, there are some parts of the process of open-sourcing existing code that are common to all Python projects. In the vein of another popular series I’ve written, “Starting a Django Project The Right Way,” I’ll outline the steps I’ve found to be necessary when open-sourcing a Python project.

Continue reading Open Sourcing a Python Project the Right Way

数据爬取和数据分析案例

数据爬取:

*如何入门 Python 爬虫?

专栏:Python爬虫入门教程

Python爬虫学习系列教程

模拟登录一些知名的网站,为了方便爬取需要登录的网站

Python 爬虫-模拟登录知乎-爬取拉勾网职位信息

Python写的链家爬虫 代码+数据

数据爬取工具或框架:

scrapy

Hawk 【重磅开源】Hawk-数据抓取工具:简明教程

pyspider

使用Wget下载整个网站
you-get(Releases · soimort/you-get · GitHub这里面有各种发布版本)。

刚开始写爬虫用的是urllib2,后来知道了requests,惊为天人。
刚开始解析网页用的是re,后来知道了BeautifulSoup,解析页面不能再轻松。
再后来看别人的爬虫,知道了scrapy,被这个框架惊艳到了。
之后遇到了一些有验证码的网站,于是知道了PIL。但后来知道了opencv,pybrain。当在爬虫中用上人工神经网络识别出验证码,兴奋得守在爬虫旁边看他爬完全站。
再后来知道了threading,知道了celery。(知乎)

使用Python进行验证码识别

数据分析案例:

有哪些网站用爬虫爬取能得到很有价值的数据?

2016豆瓣电影可视化分析报告

京东百万记录分析中国人罩杯分布 | 上150万数据 密码:guvy)

用Python侦测比特币交易的网络可视化分析

如何通过房屋租售比来判断房产的价值或泡沫?
你用 Python 做过什么有趣的数据挖掘/分析项目

知乎问题爬虫

知乎数据 API 接口 (node.js)

拉勾职位信息爬取

赶集租房信息

链家爬虫 (数据:链家数据

使用Python进行验证码识别

个人博客:

沙漠之鹰