V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yanzixuan  ›  全部回复第 15 页 / 共 17 页
回复总数  328
1 ... 7  8  9  10  11  12  13  14  15  16 ... 17  
2016-12-10 08:45:57 +08:00
回复了 a67793581 创建的主题 问与答 收到面试邀请 但是距离遥远 怎么办
距离太远的面试最好是能先电面或者对方出路费。不然对你个人的机会成本太高。
我最近面了一家公司。 hr 先电话了解我当前的工资后仍邀请我来面试。
最后花了打车费过去,第一件事情是做题!!!
然后面试官素质也不咋滴。
最后 hr 还问我:你要的工资比当前工资高合适么?
卧槽,你们公司是多有吸引力啊,挖人不涨点工资还想平着挖么?
本来一开始我就不想面了,但是都是考虑到付出了打车成本,耐着性子跟他们交流。事实证明,一开始付出太大的机会成本就是把自己放在不利的位置。
@slwl flask+gunicorn 一直用 5000 端口,然后被 nginx 反向代理为 80 端口。
2016-12-08 11:38:31 +08:00
回复了 zhuchaowe 创建的主题 React 捉急前端女友写的神级代码,我气的一口血喷的满地都是
楼主这是炫耀有女朋友么?
gunicorn+nginx 反向代理+flask, 用 flask-admin 从没遇到过问题。。。
2016-12-07 10:58:24 +08:00
回复了 alvy 创建的主题 Python 吐个槽,纯内网环境部署 python web 应用
下载最全的镜像,然后刻盘,带着这个盘去机房。然后设置源为镜像。然后开始玩吧。
2016-12-06 15:52:36 +08:00
回复了 iMmatrix 创建的主题 Python 实例讲解基于 Flask+React 的全栈开发和部署
@kaka826 可以用 FLASK-CACHE
2016-12-05 15:25:23 +08:00
回复了 honmaple 创建的主题 Python Django 如何从程序中识别爬虫?
@hugo775128583 你要相信,用 phatomjs 和 selenium 的爬虫,规模跟并发是无法于纯 python 比的。
2016-12-05 11:58:39 +08:00
回复了 honmaple 创建的主题 Python Django 如何从程序中识别爬虫?
@yangxg 算是比较叫常用的招数。
如果主页给个 token ,访问其他页面要带着 token 。
给访问次数和频率加以限制。
内容藏加载的 JS 里面,当然这主要是为了解决跨域,但是对爬虫也有点效果。
ajax 需要带制定的随机参数,这个参数的生成可以由 cookie 里的字段和其他东西+js 来生成。
防止别人爬是防不了的,你要防的是别人大规模的爬你的数据。
2016-12-01 17:44:11 +08:00
回复了 ZCPgyer 创建的主题 程序员 [蒲公英技术征文] 如何在 ESP-12F/ESP8266 上实现 webserver
@lozzow 我用这个实现了三色等 PWM 调节。然而感觉不能玩自动匹配加入 WIFI ,可玩性就差点啊
2016-12-01 15:34:22 +08:00
回复了 lzt163 创建的主题 职场话题 请问 Python 做到什么程度可以参加面试 并有机会参加工作
@wmttom 大牛带带我。
2016-12-01 15:32:56 +08:00
回复了 lzt163 创建的主题 职场话题 请问 Python 做到什么程度可以参加面试 并有机会参加工作
我是自己用 FLASK 轮了一个 BLOG 后才有自信去面试的。
2016-12-01 15:27:21 +08:00
回复了 huihui123 创建的主题 职场话题 这就尴尬了,前东家喊面试
@hanangellove 因为从华为离开的很少有不骂华为的。。
2016-12-01 15:18:28 +08:00
回复了 fanink 创建的主题 北京 [招聘] 前端工程师 [朝 11 晚 6,不打卡]
这个工作时间简直是互联网的一股清流啊。
@iannil 弱问如何在微信里抓。
2016-12-01 11:42:04 +08:00
回复了 magicdu 创建的主题 Python 如何整合 Python 爬虫与 wordpress
@magicdu 具体看网站有没有反爬措施。
一般你学习 requests+beautifulsoup 就能应对大部分网站了
2016-12-01 11:35:49 +08:00
回复了 gouchaoer 创建的主题 PHP php 的爬虫经验分享
@gouchaoer url 搞得好不好都能看出一个人认真程度。比如遇到 302 的跳转,最终的 URL 不是最初的 URL ,这个时候就需要开发者来以最终的 URL 来定。
问题是,有工程师居然不检查这个然后说我们需要去重算法。这一点我 TM 都服了。
至于去重问题,可以通过 simhash 来玩。如 mongo 的时候加上 simhash 字段。
最后去重的时候,可以设置汉明距离在设置去重的尺度。最后基本上就能做到实时去重。
抛砖引玉,不知道有没有达人有更好的玩法。
2016-12-01 11:32:02 +08:00
回复了 zxy3CNICG 创建的主题 Python 求一枚 python 大神
@JaneMa 做的东西比较杂,爬虫,大数据,搜索引擎(elasticsearch), 然后才是 flask ,感觉除了 es 比较精之外,其他的都稀松得很。怕入不了达人的法眼啊。
2016-12-01 10:37:52 +08:00
回复了 gouchaoer 创建的主题 PHP php 的爬虫经验分享
感觉最大的问题是流量问题而不是语言的效率问题。如果是反爬措施牛逼的网站,只能通过降低访问的频率+换代理的解决。这就是流量最大的瓶颈。用 PHP 还是 python 的效率还是内存占用,在这个瓶颈面前几乎可以忽略不计。
python 的分布式爬虫可以用 supervisord 来管理的。
reuqests 听好用了的,最大的问题就是跟 gevent 目前搭配还不好。虽然作者写了例子教大家怎么玩。
或者用 genvent+urllib2 来玩高效率了
2016-12-01 10:30:25 +08:00
回复了 wdhwg001 创建的主题 程序员 妈的,这是我这辈子见过的最恶心的代码。
搞不好是机器自动生成的代码。当年玩 FPGA 的时候看混淆过的 VERILOG 的路过。。。
2016-11-30 21:40:14 +08:00
回复了 zxy3CNICG 创建的主题 Python 求一枚 python 大神
用 flask 的路过。。
1 ... 7  8  9  10  11  12  13  14  15  16 ... 17  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2495 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 05:27 · PVG 13:27 · LAX 21:27 · JFK 00:27
Developed with CodeLauncher
♥ Do have faith in what you're doing.