All posts by dotte

我的的常用股票工具

用的基本工具,提供给一些刚走上超短的朋友们:

1、涨跌停温度计网址:http://stock.jrj.com.cn/tzzs/zdtwdj.shtml

我们在操作的过程中,需要复盘时,需要判断哪只股票先涨停时,通过日内分时去看非常的不方便,尤其两只股票涨停时间相差无几时更加不好判断,那么这个工具就派的上用场了,它有如下功能:
1)实时显示涨跌停的数量
查看原图

通过这张图,今天的行情如何,就一目了然。

2)实时更新涨停的具体股票及涨停时间(包括一字板)
查看原图

这个就是今天的数据,是不是很清晰。

3)显示历史的每天涨跌停数量
查看原图

方便我们判断市场环境,行情好坏。

4)显示涨跌停原因
查看原图
这个涨跌停原因我觉得不如同花顺的好用,稍后我会说。

2、财联社

网址:http://www.cailianpress.com/

1)首页的实时新闻播报
查看原图

了解到实时发生的新闻。

2)财联社早报
查看原图

这个早报每天开盘前就会有,越来越不容小觑,里面讲到的一些黑科技当天就是一字板,提到的板块也会有所表现。

3、同花顺L2

298元/年,手机和PC端都可以用。

1)超级盘口
查看原图

方便复盘当天的每一个细节,犹如电影的回放功能,非常好用。

2)涨停原因

查看原图
查看原图

进入个股的界面,按下F10即可看到,有时我们看到股票涨停,并不知道他是什么题材,什么概念,这时可以通过同花顺去查询,相对而言,比涨跌停温度计的涨停原因查询起来更加方便。

4、通达信L2

查看原图

这是我用的炒股软件,界面经过一些修改,具体的修改方法可以看这里:

怎么打造自己的操作界面:http://xueqiu.com/2894420800/56445000怎么打造自己的操作界面—-超短篇:http://xueqiu.com/2894420800/57047612
适用于分辨率1920*1080的显示器,一般的情况下用普及版就绝对够用了,如果是大资金,可以选择更高级的版本,有分仓,闪电手等功能。

查看原图

5、股票复盘

自己复盘是比较困难的,这时我们关注一些专业的复盘即可。例如TGB的柏拉爱空,厚德载物11,雪球的@TGB湖南人@云财经@天蓝星操盘手联盟  的91复盘,微信公众号的每日涨停板复盘等,这个也不用关注太多,一个就够。帮助理清当日主线,避免漏看掉某些个股。

6、实盘直播

这个TGB比较多,有再战杯,股神杯,红牛杯等等,关注一下ID,看他们的每日持仓,也是个非常好的学习方法,推荐:暗黑星星之火,最爱开板,从此开始,屠龙者  等等,每个人的操作模式都不一样,针对性的关注。

7、自己独立思考,避免从众

今天是XX的生日,所以股市一定会涨!
历史的今天上涨的概率达到80%,所以今天一定会涨!

看到这种言论我简直哭笑不得,我只能说,自己的钱只有自己能决定,你不珍惜,那么没人替你珍惜。

from:https://xueqiu.com/2894420800/64527068

基金

基金

1.什么是基金?

由证券公司发行,通过汇集众多投资者资金,交给银行保管,由专业的基金管理公司负责投资于股票和债券等证券,以实现保值增值目的的一种投资工具。 (简单的说,找个全班最能理财的人,班级里的人把钱都交给他,让他来理财)

2.基金有哪些分类?

a.货币型基金(余额宝等各种宝宝类)
特点:仅投资于货币市场工具,收益稳定,风险极低,但比银行存款高,可作为银行存款的良好替代品和现金管理的工具。
那么货币基金这么多,该如何选择呢?一句话挑选策略:阅读购买信息,确定赎回到账时间短(最好当天),手续费低(最好为0),收益稳定,天天支付结算。
b. 债券型基金
特点:主要投资于国债、央行票据、政策性金融债券,以获取较固定的收益为目的。风险和收益都较小。分类:长期纯债、短期纯债、混合债基、定期开放债券、可转债。风险:长期纯债<短期纯债<混合债基<定期开放债券<可转债 一句话挑选策略:手续费低(包括申购,赎回,托管),避开可转债(减少高风险),对比分红,用可承受小风险的资产购买(允许亏损,但持有时间放长,都可盈利,一般一年不用的闲钱)

c.混合型基金

特点:分散投资于股票、债券和货币市场工具,风险和收益水平都适中。分类:根据股票、债券投资比例以及投资策略的不同,混合型基金又可以分为偏股型基金、偏债型基金、配置型基金等多种类型。风险:偏股型基金>配置型基金>偏债型基金

一句话挑选策略(懒人策略):用导购,选出3个月,6个月,1年,2年,3年,排名都是前100的基金。几百只里大浪淘沙后剩下7只。

d.股票型基金

特点:主要投资于股票,高风险高收益,于股票大盘密切相关。分类:行业指数型基金、基金经理个人特色基金等

一句话挑选策略同混合型基金。

e.指数型基金分为行业指数型基金以及版块指数型基金。行业指数型基金侧重于行业分析,版块指数型基金侧重于对版块指数的分析。

一句话挑选策略:适合在底部区域(如现在),定期定投。选择未来新兴有发展潜力的行业板块,或者定投上证50。在心里设定好盈利上限,等到牛市时达到目标,及时退出。

注意一点,上述所有类型基金,如果出现分级B,这是加杠杆的。具体什么是分级基金,我会在别的答案介绍。就是风险会放大,不可控因素变多。投资基金还是注重安全性考虑为上,所以不推荐分级基金。

3.基金常识

购买基金一般有3个费用,自己要弄清楚,申购费,托管费,赎回费。查清楚如何收,收多少。

基金有3个指标,净值,拆分,分红。

净值就是当天买入一份基金的价格。基金净值会受当天申购、赎回数量影响,还和买的资产价格上涨下跌的影响(如股票,债券),还和货币数量的变化有关。

基金的分红及拆分,其目的是降低净值,给基民1个价格低适合买进的感觉。同时说明该基金希望扩大。基金的分红及拆分,在之分红及拆分前或后买入的效果是一样的,分红及拆分后,基金净值会降低,降低多少要看分红及拆分比例,这时(分红及拆分前后)亏盈不变。

基金买卖是以下午3:00为分界线,3:00前下单是当天3:00的价格,3:00之后下单是下一个工作日3:00时的价格。

4.当基金出现亏损时怎么办?

a保持镇静,不要盲目割肉;

b这笔钱我未来一年内要用到吗?不用的话看第三点

c大形势是否有变化,对我的基金产生什么影响?

d如果大形势不利的,最近是否可以获利了结?

5.如何选择基金经理?

有基金经理个人特色型基金,重点在基金经理持仓思路、风险偏好与经验上。

通过学习专业、以往工作经验了解基金经理的经验(基金经理简历);

通过了解操盘该基金时限,分析经理的持仓思路及风险偏好(基金经理变动一览);

通过了解任职最高回报的基金巩固自己的判断(历任基金一览);

6.个人观点

首先给结论,不推荐买股票型和混合型基金。因为基金经理虽然知识丰富,但毕竟是挣高工资去的,那么如何获得高工资就是看他掌管的基金的基金排名。同时基金亏的钱,基金经理手续费照收的,亏得不是自己的钱。这样的制度会造成,基金经理们把散户的钱投资到高风险高回报的地方去,不注重风控。容易把钱拿去炒一些小盘股,最后炒的很高,排名很好,工资涨了。想出来的时候大家都出不来,产生踩踏事件。因为一抛就跌停。

所以定投长期纯债基金(收益和P2P差不多,风险比P2P小很多),和看准大势,定投指数基金还是比较靠谱的基金选购思路。

如果真有一部分敢冒高风险的资金,自己判断选股要优于股票基金。实在懒得研究股市,那么就买指数或者按照我上面讲的懒人策略选基金吧。

投资有风险,请自己对自己的财务负责。

引自:https://www.zhihu.com/question/19801437/answer/95605458

8、基金筛选标准

我们筛选产品的标准,其实很容易理解,没有标准差、夏普比率、爱提诺比率等衍生指标,初选三大标准,大部分人都能懂,分别是:
成立时间2年以上、

成立以来年化收益20%以上、

成立以来最大回撤20%以内 。

在初选的141个产品中,我们进行了复选,也采用三个标准
首先,为了使数据更加透明,淘汰掉27个在基金业协会查不到详细备案的产品;

其次,每位基金经理只选一个产品,因为他的多个产品,收益曲线几乎相同,相关系数太高,不利于多元化的资产配置(淘汰54个产品);

最后,需从任意时间起一年,盈利不低于银行固定存款利率(淘汰37个产品)——一年不赚钱 。

到这里,才得到了令我们满意的23个基金产品。不过这个时间是截止2015年12月底。

引自:https://www.zhihu.com/question/19801437/answer/86930353

9、为什么购买指数基金

书生经常对没有投资经验的投资者说,不知道买什么基金,就买指数基金吧。那是因为,在指数上涨时,大概50%的股票基金都跑不赢指数基金,只有少数优秀基金能获得超额收益。其实股票也是这样,跑不赢指数的情况经常发生。

按跟踪的指数不同,指数基金分类

大盘指数型基金
沪深300:这是个跨市场指数,是从上海和深圳证券市场中选取了300只规模大、流动性好的300只股票作为样本;覆盖了沪深市场60%左右的市值,具有良好的市场代表性,是个大中盘指数

中证500:扣除沪深300指数样本、按日均总市值高低排名选取前500名股票作为样本,综合反映沪深证券市场内小市值公司的整体状况;是第一只综合体现沪深两市小市值企业的指数,是个小盘指数

上证50:挑选上海证券市场规模大、流动性好的最具代表性的50只股票组成样本股,综合反映上海证券市场最具市场影响力的一批龙头企业的整体状况;是优质蓝筹股的突出代表,不是期望分享高成长收益投资者的最佳选择,是超大盘指数

中证100:从沪深300指数样本股中挑选规模最大的100只股票组成样本股,以综合反映沪深证券市场中最具市场影响力的一批大市值公司的整体状况,是大中盘指数
行业指数型基金:以具体行业为跟踪目标,通常有医疗、证券银行等。

投资策略

1.上涨趋势时,投资大盘指数型基金,可以简单获得稳定收益。

2.长期下跌或震荡行情,投资行业指数基金更好。往往在熊市,医药、白酒行业能走出独立行情,而且更抗跌。

3.中证50这样的超大盘指数,样本股都是一些流通盘大、市值高的企业,短期内很难有很大发展。所以,只有出现大幅下跌后,才适合投资中证50这样的超大盘指数。

我们在看下这些大盘指数基金之间的相关系数,相关系数越大,走势越趋同。

a8bfa94305497088b1c135270b6603c2_b

这里回答文章开头的问题,我们投资多个指数基金是为了分散风险,并不是越多越好。如果买的指数走势趋同,同涨同跌,也就失去了意义。

思哲与创富 总结
1.基金定投的核心技巧在于摊低单位成本,越跌越投,波动越大获利越大。
2.基金定投的优势在于分批入市,适合工薪阶层理财,且简单易上手,没有太过于高深的技巧,弱化了择市时机的重要性,通过使用加强版的基金定投策略甚至可以获得年化20%以上的收益。
3.基金定投的核心理念是坚持定期投资,止盈不止损,当达到预期盈利目标时选择卖出或者继续定投。
4.基金定投在时间充沛的情况下周期越短越好,能充份平滑风险,增加收益。
5.基金定投的金额控制在月结余的30%-50%(激进型投资者可以在50%以上)其余金额应该分散配置在货币基金、P2P或者银行理财等等。
6.定投标的不宜过于集中,可组合配置沪深300指数、恒生指数以及标普指数基金来分散系统性风险。
7.上证点位与定投比例关系图并不是一成不变的,它随着证券市场得发展而变化,上图是我对于上证指数的见解,未来大家也要视情况进行更正。

参考:

ETF 基金到底是什么东西?

ETF,开放式基金,封闭式基金,LOF基金, 分级基金都是些啥,有何异同点

程序员搞笑集:网址是什么

Where to buy 🚀 aged domains and backlinks 🔥 from Best-SEO-Domains | 0083-0608

Where to buy 🚀 aged domains and backlinks 🔥 from Best-SEO-Domains | 0083-0608

Where to buy 🚀 aged domains and backlinks 🔥 from Best-SEO-Domains | 0083-0608

今天不给大家讲解专业知识了,我发现网上有不少关于程序员的笑话挺有意思的,这里转给大家,希望能给大家带来欢乐。

1.

“小李,我们街道的网站做好了吗”

“主任,网站建好了,需要申请网址,网址是什么”

主任打开百度查了下说,“url”

小李说,好的

于是湖南省长沙市长沙县泉塘街道的官网是 http://url.gov.cn

图0:程序员搞笑集:网址是什么

2.

A man and woman are in a computer programming lecture.The man touches the woman's breasts.

“Hey!” she says. “Those are private!”

The man says, “But we're in the same class!”

3.

客户被绑,蒙眼,惊问:“想干什么?”

对方不语,鞭笞之,客户求饶:“别打,要钱?”

又一鞭,“十万够不?”

又一鞭,“一百万?”

又一鞭。客户崩溃:“你们TMD到底要啥?”

“要什么?我帮你做项目,写代码的时候也很想知道你TMD到底想要啥!”

4.

如何解决系统问题

图1:程序员搞笑集:网址是什么

5.

我是一个苦b的程序员,今晚加班到快通宵了,困得快睁不开眼了,女上司很关心,问我要不要吃宵夜。我没好气地说,宵夜就算了,能让我睡一觉就行了。女上司红着脸说了句讨厌啊,然后坐在我身边不动,好像距离我很近,搞得我很紧张,难道她发现我的程序出了bug?

6.

一男子在路边一根接着一根地抽烟。一个女士走过来对他说:“嘿,你不知道你是在慢性自杀吗?注意看看烟盒上的警告信息。”“没关系”,男子悠然自得地又吸了一口:“我是个程序员。”“嗯?这和你是程序员有什么关系?”“我们一点儿也不在乎警告(warning),我们只在乎错误(error)。”

7.

你们饭店需要客户端吗?

不忙的时候都是小二端,只有忙的时候才需要客户端。

8.

世界上有10种人认识和不认识二进制的

9.

某程序员退休后决定练习书法,于是重金购买文房四宝。一日,饭后突生雅兴,一番研墨拟纸,并点上上好檀香。定神片刻,泼墨挥毫,郑重地写下一行字:hello world!

10.

程序员甲:哎,借我点钱呗?

程序员乙:借多少?

程序员甲:1000。

程序员乙:行。哎,要不要多借你24,好凑个整?

程序员甲:也好。

11.

我女朋友是设计师,在亚马逊kindle电子书降价的时候给自己买了一本《设计模式之禅》。

12.

手持两把锟斤拷,

口中疾呼烫烫烫。

脚踏千朵屯屯屯,

笑看万物锘锘锘。

13.

如果你对一个程序员说:你的代码有bug。

他的第一反应是:你环境有问题吧?傻逼你会用嘛!

但是如果你委婉的对他说:你这个程序和预期的有点不一致,你看看是不是我的使用方法有问题?

他就会本能的想:卧槽,是不是出bug了?!

14.

图2:程序员搞笑集:网址是什么

15.

有一天,一个男人穿越森林的时候,听到一个细微的声音叫住他。他低头一看,是一只青蛙。

“如果你亲我一下,我会变成一个美丽的公主哦。”

男人一言不发,把青蛙捡起来,放入口袋。

“如果你亲我一下,我会变成一个美丽的公主哦。而且,我会告诉我遇到的每一个人,你是多么聪明和勇敢,你是我的英雄。”

男人把青蛙拿出来,对着它微微一笑,又把它放回口袋。

“如果你亲我一下,我会变成一个美丽的公主,然后我愿意成为你的爱人一星期。”

男人又把青蛙拿出来,对着它微微一笑,把它放回口袋。

“如果你亲我一下,我会变成一个美丽的公主,然后我愿意成为你的爱人一年,而且你可以对我做任何事。”

再一次的,男人把青蛙拿出来,对着它微微一笑,又把它放回口袋。

最后,青蛙无力地问:“我开出了这么好的条件,为什么你还不肯吻我?”

男人说:“我是一个程序员,我可没时间和什么公主鬼混。不过,拥有一个会说话的青蛙,倒是蛮酷的。”

16.

图3:程序员搞笑集:网址是什么

17.

产品经理失踪了程序员第一时间到警察局报警。

警察对程序员说:

你先冷静你这样一直笑没办法做笔录

18.

图4:程序员搞笑集:网址是什么

19.

小明去小卖铺买饮料,对老板说,要两瓶果汁。

于是老板拿给他两瓶果汁。

小明数道:第0瓶,第1瓶,第2瓶。。。

好,他拿起第二瓶喝了。

“啊,烫烫烫烫烫烫!!!”

20.

图5:程序员搞笑集:网址是什么

机器学习&深度学习研究者最重要的11张速查表

作者 Kailash Ahirwar 在 Github 上建立了一个代码速查表,对机器学习初学者来说是不可多得的一个资源。机器之心将文章中的高清图片下载到了百度网盘,读者可从中浏览。也可以点击这里查阅 Medium 上的原文。

对于初学者来讲,入门机器学习和深度学习非常困难;同时深度学习库也难以理解。通过收集多方资源,我在 Github 上创建了一个速查表库,希望能对你有所帮助。欢迎访问这个库,并完善它(如果你也有速查表)。

1.Keras

Keras 是一个非常强大且容易上手的深度学习库;当 Keras 接入 Theano 和 TensorFlow 时,后两者可提供高水平的神经网络 API 以开发和评估深度学习模型。该速查表可用于 Python 数据科学和机器学习。

1-uEv0-859Tp3GK5ynmoLq5w(1).jpeg

2.Numpy

Numpy 库是 Python 中科学性计算的核心库,它提供高性能、多维度的数组对象,以及对这些数组进行运算的工具。该速查表可用于 Python 数据科学和机器学习。

1-o_CO_8Plpi2Ac3s-Gs5IQg(1).png

3.Pandas

这张 Pandas 速查表主要用于数据整理(data wrangling)。

Pandas 库构建在 NumPy 上,并为 Python 编程语言提供易于上手的数据结构和数据分析工具。该速查表可用于 Python 数据科学和机器学习。

1-YhTbz8b8Svi22wNVvqzneg(1).jpeg

1-3-mTHM3ejorJwLnjuIpVNQ(1).jpeg

1-2RJpJMci8ysUbrFOCzPKAw(1).png

4.SciPy

SciPy 库是科学性计算的核心包之一,科学性计算可提供数学算法和构建在 Python 的 NumPy 扩展上的便捷函数 (Convenience Functions) ;该表中还包括线性代数的部分。该速查表可用于 Python 数据科学和机器学习。

1-9gFze6fk9EHcm1bgJsmgFA(1).png

5.Matplotlib

Matplotlib 是一个 Python 2D 绘图库,它在平台上以多种硬拷贝格式和交互环境生成发表品质的图。该速查表用于 Python 数据科学。

1-ykxp7OpgBXbRRHgjzSkeCA(1).png

6.Scikit-learn

Scikit-learn 是一个开源 Python 库,通过统一接口实现一系列的机器学习、预处理、交叉验证和视觉化算法。该速查表可用于 Python 数据科学和机器学习。

1-uEv0-859Tp3GK5ynmoLq5w(1).jpeg

7.Neural Networks Zoo(神经网络大全)

该速查表几乎涵盖了所有类型的神经网络。

1-gccuMDV8fXjcvz1RSk4kgQ(1).png

8.ggplot2

ggplot2 基于图形语法,其思想是你可以利用相同的几个组件构建所有的图形:一个数据集、一个几何集(表征数据点的视觉化标记)和一个协作系统。该速查表用于数据可视化。

1-GOqZNLbHU_d1rZ5qP5RuTQ(1).jpeg

1-kHi0M3FgxGs4CtUW4Rsm-w(1).jpeg

from:http://www.jiqizhixin.com/article/3004

机器学习及大数据相关面试的职责和面试问题

目录

· 机器学习、大数据相关岗位的职责

· 面试问题

· 答题思路

· 准备建议

· 总结

各个企业对这类岗位的命名可能有所不同,比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。

机器学习、大数据相关岗位的职责

根据业务的不同,岗位职责大概分为:

1、平台搭建类

· 数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;

2、算法研究类

· 文本挖掘,如领域知识图谱构建、垃圾短信过滤等;

· 推荐,广告推荐、APP 推荐、题目推荐、新闻推荐等;

· 排序,搜索结果排序、广告排序等;

· 其它,· 广告投放效果分析;· 互联网信用评价;· 图像识别、理解。

3、数据挖掘类

· 商业智能,如统计报表;

· 用户体验分析,预测流失用户。

以下首先介绍面试中遇到的一些真实问题,然后谈一谈答题和面试准备上的建议。

面试问题

1、你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法?

2、你熟悉的机器学习/数据挖掘算法主要有哪些?

3、你用过哪些机器学习/数据挖掘工具或框架?

4、基础知识· 无监督和有监督算法的区别?· SVM 的推导,特性?多分类怎么处理?· LR 的推导,特性?· 决策树的特性?· SVM、LR、决策树的对比?· GBDT 和 决策森林 的区别?· 如何判断函数凸或非凸?· 解释对偶的概念。· 如何进行特征选择?· 为什么会产生过拟合,有哪些方法可以预防或克服过拟合?· 介绍卷积神经网络,和 DBN 有什么区别?· 采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?· 用 EM 算法推导解释 Kmeans。· 用过哪些聚类算法,解释密度聚类算法。· 聚类算法中的距离度量有哪些?· 如何进行实体识别?· 解释贝叶斯公式和朴素贝叶斯分类。· 写一个 Hadoop 版本的 wordcount· ……

5、开放问题

· 给你公司内部群组的聊天记录,怎样区分出主管和员工?

· 如何评估网站内容的真实性(针对代刷、作弊类)?

· 深度学习在推荐系统上可能有怎样的发挥?

· 路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路况做出合理估计?采集数据中的异常值如何处理?

· 如何根据语料计算两个词词义的相似度?

· 在百度贴吧里发布 APP 广告,问推荐策略?

· 如何判断自己实现的 LR、Kmeans 算法是否正确?

· 100亿数字,怎么统计前100大的?

· ……

答题思路

1、用过什么算法?

· 最好是在项目/实习的大数据场景里用过,比如推荐里用过 CF、LR,分类里用过 SVM、GBDT;

· 一般用法是什么,是不是自己实现的,有什么比较知名的实现,使用过程中踩过哪些坑;

· 优缺点分析。

2、熟悉的算法有哪些?

· 基础算法要多说,其它算法要挑熟悉程度高的说,不光列举算法,也适当说说应用场合;

· 面试官和你的研究方向可能不匹配,不过在基础算法上你们还是有很多共同语言的,你说得太高大上可能效果并不好,一方面面试官还是要问基础的,另一方面一旦面试官突发奇想让你给他讲解高大上的内容,而你只是泛泛的了解,那就傻叉了。

3、用过哪些框架/算法包?

· 主流的分布式框架如 Hadoop,Spark,Graphlab,Parameter Server 等择一或多使用了解;

· 通用算法包,如 mahout,scikit,weka 等;

· 专用算法包,如 opencv,theano,torch7,ICTCLAS 等。

4、基础知识

· 个人感觉高频话题是 SVM、LR、决策树(决策森林)和聚类算法,要重点准备;

· 算法要从以下几个方面来掌握 产生背景,适用场合(数据规模,特征维度,是否有 Online 算法,离散/连续特征处理等角度);原理推导(最大间隔,软间隔,对偶);求解方法(随机梯度下降、拟牛顿法等优化算法);优缺点,相关改进;和其他基本方法的对比;

· 不能停留在能看懂的程度,还要对知识进行结构化整理,比如撰写自己的 cheet sheet,我觉得面试是在有限时间内向面试官输出自己知识的过程,如果仅仅是在面试现场才开始调动知识、组织表达,总还是不如系统的梳理准备;从面试官的角度多问自己一些问题,通过查找资料总结出全面的解答,比如如何预防或克服过拟合。

5、开放问题

· 由于问题具有综合性和开放性,所以不仅仅考察对算法的了解,还需要足够的实战经验作基础;

· 先不要考虑完善性或可实现性,调动你的一切知识储备和经验储备去设计,有多少说多少,想到什么说什么,方案都是在你和面试官讨论的过程里逐步完善的,不过面试官有两种风格:引导你思考考虑不周之处 or 指责你没有考虑到某些情况,遇到后者的话还请注意灵活调整答题策略;

· 和同学朋友开展讨论,可以从上一节列出的问题开始。

准备建议

1、基础算法复习两条线

· 材料阅读 包括经典教材(比如 PRML,模式分类)、网上系列博客,系统梳理基础算法知识;

· 面试反馈 面试过程中会让你发现自己的薄弱环节和知识盲区,把这些问题记录下来,在下一次面试前搞懂搞透。

2、除算法知识,还应适当掌握一些系统架构方面的知识,可以从网上分享的阿里、京东、新浪微博等的架构介绍 PPT 入手,也可以从 Hadoop、Spark 等的设计实现切入。

3、如果真的是以就业为导向就要在平时注意实战经验的积累,在科研项目、实习、比赛(Kaggle,Netflix,天猫大数据竞赛等)中摸清算法特性、熟悉相关工具与模块的使用。

总结

如今,好多机器学习、数据挖掘的知识都逐渐成为常识,要想在竞争中脱颖而出,就必须做到· 保持学习热情,关心热点;· 深入学习,会用,也要理解;· 在实战中历练总结;· 积极参加学术界、业界的讲座分享,向牛人学习,与他人讨论。最后,希望自己的求职季经验总结能给大家带来有益的启发。

附:其它可能的题目-算法/架构/ETL等

  • MapReduce解决缺值问题?
  • 集群规模有限,但之前的那个文件足够大,如何解决?(不能调整集群的规模)
  • Spark的三种部署方式?
  • 如果Spark用的和Mapreduce的计算资源同是yarn,发现资源不够用了话,在Spark中的哪里进行配置,使之资源分配合理?
  • LVS的配置相关命令?
  • Hadoop的各角色的职能?
  • Hadoop的checkpoint的作用?
  • HBase的双主如何配置?
  • HBase即便拥有双主的高可靠配置,存在hdfs上的数据丢失怎么办?
  • HBase模糊查询,是什么?如何做到?
  • Hadoop的 高可靠性,如何保证?
  • 如何保证HBase的稳定性以及高可靠性?从部署、容灾、以及网络方面说说你的看法?
  • 你觉得Spark和Hadoop的区别是什么,请简要说一说?
  • 你觉得Python和Java在使用起来,有什么区别?
  • 给你两张表,表A和表B,其中表A有3条数据,表B有5条数据,问:表A left join 表B后有几条?
  • LVS和HAProxy相比,它的缺点是什么?
  • Sqoop用起来感觉怎样?
  • ZooKeeper的角色以及相应的Zookepper工作原理?
  • HBase的Insert与Update的区别?
  • 数组与链表的区别是什么?
  • Scala函数式编程的特点?
  • 今日头条的个性化推荐是如何实现的?
  • spark工作原理
  • spark运行原理
  • Spark Streaming
  • Storm的ack是干嘛的
  • kalfka干嘛的
  • job提交到yarn上的工作流程
  • 10x+5y+z = n,x+y+z的最小值
  • ArryList、LinkedList、vector的区别
  • hashMap HashTable的区别
  • 垃圾回收机制
  • JVM的工作原理
  • Hbase的垃圾回收工具
  • for循环LinkedList
  • 遍历HashMap的并且把某一个值删除
  • 线程 进程
  • Java中Runnable和Thread的区别Callable
  • Callable与Future的介绍
  • sleep wait区别
  • hadoop源码使用了什么JAVA技术
  • hadoop的通讯接口RPC协议
  • java的数据类型
  • mapreduce中的Text类型 LongWriteable 能不能用String 或者用long类型代替
  • JAVA如何实现序列化
  • 反序列化是什么?
  • 序列化是将(内存中的)结构化的数据数据,序列化成2进制
  • mapreduce常用的接口
  • mapreduce的工作流程
  • MR优化方式
  • 什么样的情况下不能用mapreduce
  • HDFS的架构
  • hdfs改那几个文件 分别改什么内容 内容代表什么意思(3次)
  • core是全局的 site是局部的
  • hdfs优化
  • mapreduce怎么实现join连接
  • yarn的ha搭建
  • zookeeper的工作原理和应用场景
  • 如何解决mapreduce的数据倾斜
  • mapreduce怎么实现把移动数据到移动计算的
  • hive 增加数据有几种方式
  • 怎么给hive的表里面增加一个字段
  • 增加的字段里面数据占不占内存
  • 给字段增加值怎么增加
  • 1g的小文件,1g的一个文件 ,为什么小文件占的空间更大
  • hive建表,什么情况下见内部表
  • impala 依赖
  • 怎么解决hive数据倾斜问题
  • hbase rowkey的设计原则
  • 唯一 简明有意义
  • hbase的应用场景
  • 你们平时PV有多少,数据量有多少
  • Hive是重点
  • hadoop工程师
  • zookeeper在hbase中作用
  • ZK中存的两张最重要的表
  • shall 数组的分隔符是什么
  • linux的copy

End.

转载请注明来自36大数据(36dsj.com):36大数据 » 机器学习及大数据相关面试的职责和面试问题