V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ppyybb  ›  全部回复第 13 页 / 共 16 页
回复总数  301
1 ... 5  6  7  8  9  10  11  12  13  14 ... 16  
2018-08-10 17:37:58 +08:00
回复了 CopenhagenCat 创建的主题 问与答 转行机器学习算法或深度学习方面的疑问
@CopenhagenCat 给一个建议,先转成大数据试试,接触基本的数据挖掘算法,参与实际的业务,然后再进一步考虑。这样进退皆可,比较灵活,也不会让你一下找不到工作
2018-08-10 17:07:12 +08:00
回复了 CopenhagenCat 创建的主题 问与答 转行机器学习算法或深度学习方面的疑问
两个原因:
1 入门门槛高,虽然入门的机器学习知识其实大学本科的数学就够了,后面的可以边学边补,但是很多人都很难捡起来了。
2 找工作门槛高 现在想去大公司做算法相关已经不比几年前了,没有工程经验很难进去。而这种东西又是你自己一个人学不到的,大多数人只能停留在打比赛的层次。但是现在由于人太多导致门槛提高,这个已经不够用了(阿里星水平这种就不用拿出来讨论了)你可以看看现在应届生想做机器学习的有多少,你转行面对他们的优势又有多大呢?当然不是没机会了,但是单纯自学然后强行转,很可能前途还不如做开发
2018-08-07 21:28:01 +08:00
回复了 yizhimamong 创建的主题 职场话题 阿里 P6+的待遇
想问 2 个问题
阿里股票四年发完了就没有了,也就是说以后的收入会大大减少?
而且股票交税都是一次性的(公司应该不会分摊到每个月帮你避税吧),实际到手应该少很多吧?
2018-08-07 12:44:40 +08:00
回复了 waiaan 创建的主题 JavaScript 问一个算法的思路
如果要求用户至少花费 k 元,那么可以提供一个思路:
假设不妨设一共 N 个菜,设状态 dp[i][S] 为处理了前 i 个菜,一共点了 S 的价格的状态(0 表示不存在这个状态,1 表示存在这个状态)
先不考虑满减,显然 dp[i + 1][S + price[i + 1]]
dp[i+1][S] = dp[S]
所以 dp[N-1]表示所有菜都考虑了的情况,那么考虑满减 dp[N-1][S] - discount (如果有多个满减,就找最近点那一个)
结果就是最小的那个

这种情况如果 S 的总价格不是很大,那么状态不会很多(我们可以假设用户不会点超过 1000 的外卖,S <= 1000,如果超过一般都会超过最大的满减上限了)
也就是搜索一个 N * S 的状态空间就可以解决

优化空间: 显然 dp[i]只依赖 dp[i-1],所以两个一维数组就可以解决
剪枝: 保留当前最小的 S - discount,那么我们可以判断从当前状态出发是否存在更小的可能,这里分类讨论可能的 discount
缓存: 从业务考虑,我们完全可以先计算好前 100 个状态,然后需要的时候直接从缓存好的状态开始计算起(时间和空间的 tradeoff)
2018-08-06 22:07:58 +08:00
回复了 backfrw 创建的主题 问与答 有点迷茫,应届毕业怎么提升?
@backfrw 我也不是啥前辈,工作也才 1 年多,也是准备从成都往北京跳的。

我回答你的问题:
1 我定义的知识体系,就是你从事的这个领域,你能从头到尾的理解整个流程。能把各个层的东西融汇贯通并加以扩展。举个例子:做 web 后端开发(这里含领域知识,比如支付,直播,搜索),以浏览器为分界线,
http 层面要懂(各种 header,code 的意义和使用,以及遇到问题能否判定是这个层出了问题)
接着 tcp 要懂(遇到网络异常能否判定是不是传输层面出问题了,比如服务器 timewait 状态很多导致链接失败是怎么回事?),可以写个 io 多路复用的程序可以吗(比如用 netty 写个多线程异步调用的 client 去做某些业务能做到吗?)

负载均衡怎么做的?(了解 nginx 原理吗,具体怎么配置?需要自己写第三方的负载均衡模块吗?)

然后框架原理,比如你用某个框架,从它 parse 出 http 包开始,到你的 controller 层是怎么个情况,出 bug 了能定位问题吗?能直接看源码找到问题吗?

然后到框架的 orm 大概是什么原理,怎么映射到后端的数据库,如果需要支持某个 database 但是你这个框架又没有合适的开源组件,能自己搞定吗?数据库客户端的链接池特点是什么,对开发的影响。各种 filter/hook 是怎么实现的,怎么应用?出问题能定位吗?

然后到数据层面,先是缓存,redis 的基本原理要懂,如果有周期性的卡顿能通过日志分析出原因吗(这里还考验逻辑推理能力),主从有什么坑,集群原理,有什么坑。最关键的,怎么针对业务涉及一套合适的 cache 体系(这个挺难,没实战积累感觉和经验很难做到),还需要对各种命令的复杂度有所了解(这也附带要求理解内部数据结构)

然后到 db,这种一般源码太复杂了(比如 mysql innodb ),所以看看文章了解基本原理,比如 insert 并发怎么导致了一个死锁?(要求对 mysql 加锁机制非常熟悉,这个还需要去查资料) update 语句会锁哪些地方(反过来思考索引)查询怎么走索引( selectivity 怎么样?),排序 /分组怎么走索引(能利用索引的两种优化机制吗?)自带分区表能不能业务中用上,有哪些坑?应该怎么分表(冷热数据对缓存友好,但是有可能业务中不方便带分区参数) column 类型的选择,text/blob 的存储模型(影响取数据),int,mediumint,smallint,bigint 可以选哪个?各种参数(如果走阿里云一般默认的就很好了)主从,集群有什么坑?(这个我目前也不懂)出问题了怎么迅速恢复数据(至少恢复大致数据然后靠应用层逻辑校对)
你搞统计还得设计一手好 sql,数据量大了就要上各种大数据工具。

再有 cdn,具体的 api 熟悉吗,上传不同类型数据有什么坑(比如有些上传了不是马上见效),怎么加速?

还有应用内,项目用的什么 rpc,原理了解吗(网络,线程模型,编解码,重试,负载均衡),有哪些功能,需要自己 hack 能做到稳定可用吗?各种中间件( mq,log,proxy 了解吗?我也不了解哈哈)

语言,best practice 了解吗?(知道这样做的原因吗?,知道这样做的场景吗?)各种内置的数据结构原理了解吗?并发呢?(各种并发模型,这个我也不太懂)各种坑就不说了。调优也是有可能的。

然后就是算法和数据结构,这个往往涉及到一些比较复杂的业务(硬骨头)时候可能用到,比如让你做成给产品可配置化的界面,让它们设定任意树状结构的统计分类,你怎么弄?现在需求改了,你需要合并两颗树(相同路径合并,同时有复杂的业务条件限制),怎么弄?
数据量太大,能不能搞个 bitmap 代替 set ?放 redis 还是直接放内存里面( db 做持久化?)
有时候可能需要来个桶排序你能想到吗?如果需要在内存里面做可持久化的数据结构怎么弄?比如 bk 树,avl 树 /rb 树 /skiplist (现在有 redis 可以替代了),怎么序列化?(自带的序列化机制原理?慢吗?可以优化吗?开源的原理?性能够用吗?)
万一需要动态规划 /搜索算法来算个最优解(这个往往出现在游戏里面,或者一些调度问题)能想到吗?字符串匹配怎么做?能针对业务优化吗?(往往内存放不下)

最后也是很重要的领域知识,这个只有去对应的项目才能积累了(直播,支付,ai 底层平台开发,中间件开发等等)

还有系统架构能力,这个挺吃天赋和经验的,我也不懂,只能多反思自己的代码,多看看别人的设计,多想想能不能迁移 /抄袭这些设计。

逻辑思维能力,这个感觉比较难提升,但是通过熟悉业务和领域知识应该可以一定程度弥补

以上就是近几年(初级到中级)自己进步的思路,但是具体来做,肯定还是业务优先,先把业务搞熟悉,做到按时按质量交付,然后考虑怎么写更好,然后就有机会做更核心的,理论实践结合,下班可以花时间自己造轮子玩玩。
2018-08-06 18:15:26 +08:00
回复了 backfrw 创建的主题 问与答 有点迷茫,应届毕业怎么提升?
@backfrw 往框架上努力没有问题,但是这个时候最重要的其实是形成一套自己的知识体系,这是你在某个领域的核心竞争力。要达到这个目的第一基础必须很扎实,第二必须在一个有一定难度的项目里面长时间的参与开发,同时尽可能扩展业务边界线,涉及核心的技术。

你要做到 2 就必须做到 1,否则面试就过不了,更不要说去个不错项目了。而做到 2 最忌讳的就是一个项目做三个月然后就又换一个,这样你的知识体系会很零碎,没什么机会把理论和实践结合起来,总是在和一些琐碎的表层知识和新的业务做斗争,很难成长。

你目前公司太水了,让你搞东搞西的,你又根本没有话语权,你只能利用业余时间加班学习,争取做到扎实基础,业务用到的框架熟悉基本原理(至少看看网上的文章解析这种),然后造几个小轮子什么的。然后跑路。
2018-08-06 14:00:10 +08:00
回复了 backfrw 创建的主题 问与答 有点迷茫,应届毕业怎么提升?
不是大佬
我认为问题在于两点:
1 是否有时间来反思写过的代码?一般来说 code review 对自己提升还比较大的,无论是别人还是自己 review

2 是否对用到的技术进行加深了解?比如用到 mysql,是否对 mysql 事物级别,mvcc,各种锁的机制了解?是否了解索引对应在磁盘上的数据结构?
用到 java,是否对 jdk 集合的原理有所了解?对多线程的各种坑,线程池,future 等原理有所了解?

如果只是简单的外包+加班,能够直接获益的可能不多,考虑下班有时间自己学习,争取去一些有较大数据量和一定并发量的公司写业务。
2018-08-02 18:14:16 +08:00
回复了 zynlp 创建的主题 问与答 头发越长越慢了,担心脱发…脱发有什么前兆吗?怎么预防?
剪光头 | 戴帽子
老哥你 15 年就加入 v 站了,你在啥工厂这么 6
不会是鹅厂,狼厂,菊花厂吧
@hungrygenius 其实不是拿的多和少,而是很难进。拿的对比以前可一点也没减少,但是门槛提高了很多。
现在的趋势是,大公司已经不怎么想要那些能力一般的算法研究生了,大家都想高薪挖老司机,如果你还是处于一个打打比赛,做了一些普通项目,懂基本算法原理的水平,可以说很难找到理想的工作。

小公司有戏,因为招不到牛逼的应届生,但是小公司很多根本就没有足够的数据来支撑 ai,也不需要 ai,只是跟风。如果过两年泡沫稍微去一点,你小公司的就惨了,又不是核心业务,第一个砍的就是这些人。
@hungrygenius 意思应该是学人工智能不一定能成功,但是教别人人工智能的都已经赚钱了...

现在 ai 领域竞争非常激烈,具体情况可以在知乎上搜索到,前几年入行和现在入行拿到 offer 的难度差异非常大.
2018-07-26 17:07:09 +08:00
回复了 ying2337 创建的主题 酷工作 [北京] 招聘量化开发实习生
当年找实习投了个量化的岗位,一面就挂了....
然后老老实实做后端....
2018-07-26 13:18:46 +08:00
回复了 lk0317 创建的主题 程序员 项目经验太差,面试找工作好艰难,求建议
@lk0317 就是看看你做的项目的意思
2018-07-26 11:20:32 +08:00
回复了 lk0317 创建的主题 程序员 项目经验太差,面试找工作好艰难,求建议
老哥我感觉我也一定程度面临这个问题...
你把简历放出来呗,case by case 的看到底有哪些可以调整修改的
2018-07-25 19:47:07 +08:00
回复了 wuyanwuyan 创建的主题 问与答 前端想往直播行业走,需要什么样的学习路线。
https://www.zhihu.com/question/22567173/answer/73610451
怎么写一个视频编码器,不过估计还是先找书教材看看比较好
2018-07-25 17:18:30 +08:00
回复了 netStand 创建的主题 MySQL mysql 问个问题。大神们请不吝赐教。
必须是同一行吗?这些操作实时性要求高吗(能否排队处理?)在更新期间是否有大量读操作(如果有是否要求一定是最新数据?)

如果你的场景是类似大量商品秒杀的这种场景,且必须立刻返回结果的话,且有大量读操作,且必须保证读的数据是最新的话……
我感觉就不应该使用 mysql....,这似乎到了单机处理能力的极限,而且还会有严重的竞争。
如果读操作可以不那么精确(允许一点溢出或者业务上做分段的模型处理),且拒绝使用缓存的话,那么可以尝试进行分段处理,把一行分散到多行,读的时候全部加起来返回(同时记得关掉 mysql 的 cache..)

具体业务情况不了解,以上都是我瞎想的 23333333
2018-07-24 23:53:42 +08:00
回复了 chunjie 创建的主题 程序员 em......
没看懂,是 transgender 还是药娘?还是只是一个长得比较中性的妹子?
如果是 transgender 为什么会保留妹子的头像(按照常理应该庆幸摆脱过去的性别困扰才对?)
2018-07-24 23:48:11 +08:00
回复了 alexfarm 创建的主题 MySQL 关于 Mysql 全表扫描时的插入问题
是什么存储引擎,隔离级别是 rc 还是 rr ?如果是 innodb 的话,快照读不会加锁,不影响插入。如果是当前读导致全表扫描,那么应该会锁住所有记录(全部加 next-key,同时加入一个表级意向锁,但是不会采取表锁,可以自行验证),这时候插入应该会被阻塞,因为插入带来的插入意向锁和 next-key 是冲突的。(否则就会导致幻度,这违反 rr 的定义)
2018-07-21 20:47:15 +08:00
回复了 zjsxwc 创建的主题 程序员 有没有微信群聊机器人?
可以考虑自己 hack 微信客户端,然后用专门的几个手机做这件事
1 ... 5  6  7  8  9  10  11  12  13  14 ... 16  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2658 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 89ms · UTC 06:21 · PVG 14:21 · LAX 22:21 · JFK 01:21
Developed with CodeLauncher
♥ Do have faith in what you're doing.