寻找技术顾问: Elasticsearch、Android 底层、Kafka、Minio、分布式爬虫、Ansible - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
sunchuo
V2EX    程序员

寻找技术顾问: Elasticsearch、Android 底层、Kafka、Minio、分布式爬虫、Ansible

< href="Javascript:" Onclick="upVoteTopic(742381);" class="vote">
  •  1  
  •   sunchuo 2021-01-07 02:48:30 +08:00 4792 次点击
    这是一个创建于 1743 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Hi

    不好意思打扰大家了。

    是这样的:因为公司业务发展还算挺快,我们已达到能力天花板又智商不行。学习新的东西很慢,从不知道怎么搞,到大概知道怎么搞但是又没搞过,搞出来了又遇到各种各样的小问题去各种解决。

    整个过程充满选择纠结、认知不全面的不安、各种小问题一个接着一个的烦躁。精力都花在架构上而不是业务。 所以希望能在我们需要的一些领域里,找到 1 ~ n 个技术顾问。能够指导我们针对业务场景提供方案,指导快速上手,遇到问题给个思路。

    这些领域包括:

    Android 偏底层,反编译看同类的技术实现思路、保活、提升推送到达率、反反编译等。

    Elasticsearch,部署、配置、参数调优,中文支持,拼音搜索、首字母搜索、同义词搜索、纠错等。

    Kafka,部署、配置、参数调优。

    Minio,分布式部署、多域名、多用户,每个用户存储空间、请求数、流量、带宽统计。

    分布式爬虫,如何设计分布式爬虫支持多种语言的 worker 。

    Ansible,服务器初始化(升级、防火墙、sshd 修改),部署代码。

    PHP Swoole,如何用 swoole 写出虽然不快但是比也不太慢的代码。

    Q&A:

    问:你们大部分问题云服务都完美解决了,还免运维,为啥要自己折腾?

    答:成本,我们在机房租用一台机器相同硬件性能(配置不准云会超售)、带宽的情况下,云服务成本大概是 20 倍。

    问:怎么个合作方式?

    答:1. 加好友。2. 说一下自己非常擅长哪方面。3.遇到问题就问您,并且说明想要什么样的结果。4. 您如果足够胜任,评估一下要多久,想要多少钱。5. 同意。6. 您给解决问题的文档。7. 付钱。8. 文档不理解的地方可能麻烦您解释一下。9. 问题解决。 如果中间有各种各样的原因导致没成功走到 9,希望买卖不成仁义在,继续做好友,下次遇到问题从 3 继续开始走。

    问:合作会持续多久?

    答:取决于 我们业务,您,谁扛得久。取小值。

    问:不好意思谈钱怎么办?

    答:您一天工资是多少,正常上班,去掉摸鱼时间,去掉和产品经理扯皮的时间。每天有效工作时间也就 2 ~ 3 小时。您解决我们的问题需要多少个 2 ~ 3 小时,就当多少天。

    问:你们有钱么?

    答:紧巴巴的,不然就招全职了。

    问:这种人不屑于赚你这种小钱。

    答:我相信乐于助人是主因,认识几个新朋友为辅。零花钱只是.....。让知识有尊严。

    问:找不到顾问怎么办?

    答:一边自己继续慢慢扣脑袋学。一边继续找。

    问:你微信多少?

    答:sunchuo

    35 条回复    2021-01-11 09:15:15 +08:00
    asuraa
        1
    asuraa  
       2021-01-07 04:18:50 +08:00   3
    你这就是 又不想给云厂商钱搞定基础设施
    又不想自己花钱招人搞定基础设施
    mepwang
        2
    mepwang  
       2021-01-07 07:16:45 +08:00 via iPhone
    即使放在十几年以前,一个能从解决方案到底层都精通的顾问,一天也得一万块。算下来还是云服务更便宜呢
    JosephHan
        3
    JosephHan  
       2021-01-07 08:49:13 +08:00 via Android
    我在公司就是干这些的,年薪合人民币 20 万外加公司给包全家移民。所以你觉得给多少时薪才好意思招这个职能的顾问?我劝你们还不如直接上公共云。
    cloudhuang
        4
    cloudhuang  
       2021-01-07 08:57:49 +08:00
    > 云服务成本大概是 20 倍
    cloudhuang
        5
    cloudhuang  
       2021-01-07 09:01:51 +08:00
    > 云服务成本大概是 20 倍
    V 的这个编辑器。
    其实建议还是上云服务器,因为这个成本是确定的,比如就是 20 倍。但是兼职的问题不提,其隐形成本是不固定的,比如时间,方案的准确性,可靠性等等,这就不单单是钱的问题了。(如果有靠谱的朋友,推荐靠谱的人,则相对来说会好一些。但是这个靠谱,无法准确定义和准确评估)
    Yano
        6
    Yano  
       2021-01-07 09:03:48 +08:00
    @luodaoyi 一语中的
    lancelee01
        7
    lancelee01  
       2021-01-07 09:21:26 +08:00
    需要 ClickHoues 顾问吗[doge]
    rrfeng
        8
    rrfeng  
       2021-01-07 09:54:54 +08:00 via Android
    es kafka ansible 可接
    huruwo
        9
    huruwo  
       2021-01-07 10:56:39 +08:00
    楼上的看清楚 虽然云服务可以解决一部分但是这个

    Android 偏底层怎么云服务
    分布式爬虫架构搭建怎么云服务

    云服务不是万能药 关键还是要上真人
    sunchuo
        10
    sunchuo  
    OP
       2021-01-07 13:55:32 +08:00
    @luodaoyi
    @Yano
    我没有任何想省钱、捡便宜的想法。请仔细看 Q&A 部分。
    我们只需要指导、让我们少走弯路、快速学会。不是找人帮我们干活。

    @mepwang
    坦诚地说,我们在机房的机器硬件免费,只需要付带宽钱。10G 在各大云要多少一个月知道不?


    @JosephHan
    我给顾问付钱的算法在 Q&A 里讲的很清楚了:2 ~ 3 小时当成一个工作日付日薪。这个价格我挺好意思的。
    羡慕你年薪 20 万,祝你越涨越多。

    --------

    @cloudhuang 以我的经验来看,怼机器是最好的办法。作为一群老人我们有丰富的落后技术的经验。只是学习能力变弱了。 所以想找个人帮我们少走弯路。


    @lancelee01 不太了解 ClickHoues,我们是 10 亿级数据,每行大概 600k 。需要全文索引。需要更新操作。



    @rrfeng 能麻烦您加一下我微信嘛?感谢!


    @huruwo 感谢。
    lancelee01
        11
    lancelee01  
       2021-01-07 15:15:15 +08:00   1
    ClickHouse 是一个 MPP 架构的列式数据库管理系统,适用于数据不可变,聚合分析操作的场景。一般用于 BI,以及基于 BI 衍生出来的数据分析场景,比如风控、游戏数据分析等。
    vus520
        12
    vus520  
       2021-01-07 16:13:25 +08:00
    大规模数据,自建 IDC 的成本远低于上云的成本。
    mumubin
        13
    mumubin  
       2021-01-07 20:04:20 +08:00
    我司疫情期间自建数据中心不够用了,买了 aws 的服务,一个月 100w 刀。服务是真的贵,不过各方面做的是真的好
    hantsy
        14
    hantsy  
       2021-01-07 20:08:20 +08:00
    这个基础设施搞好,不容易。加油啦。

    话说回来,国内的云不如自己搞。
    westoy
        15
    westoy  
       2021-01-07 20:23:03 +08:00   1
    没戏, 真的

    大家都知道, 其实一天能集中精力干活儿的也就几个小时, 兼职顾问不可能持续性的投入精力跟进你们项目

    而且双方避嫌, 肯定要业务脱敏的啊, 这种偏底层偏架构的一旦脱离业务和规模, 很难针对性解决问题

    单一两个方面, 双方克服一下困难也就算了, 你这边是全面开花了
    firefox12
        16
    firefox12  
       2021-01-07 20:40:20 +08:00
    他的需求不是用云可以解决的, 云完成的是基础架构。 他的需求不是搭建个 es 这么简单,需要在这个领域有很多经验可以迅速解决问题的。里面任何一个点都是一道面试题。而且 他的问题是很实际的,没有实际解决过类似问题的人多半是搞不定的。
    firefox12
        17
    firefox12  
       2021-01-07 20:43:42 +08:00
    从问题上 可以看出他们的需求都是可扩展性的点,简单的说 是要这个项目的 cto, 高速 指导大家绕过所有的坑,快速的上线整个项目,保证这个项目可持续的发展。 因为他说了 他们是一群有技术的人, 准确的说 他们有一些经验,但是这些经验要支持他们从现在的量级 向 2 个量级以后扩展可能不够。 他们目前是 10 亿,他们可能要的是直接上 1000 亿的 这条路。
    undeflife
        18
    undeflife  
       2021-01-07 23:06:07 +08:00
    minio 那条 你这不就是要在 minio 上实现 S3 吗?
    hotsymbol
        19
    hotsymbol  
       2021-01-07 23:13:29 +08:00
    这不是典型的白嫖心理吗。就是不用云服务。就是要用本地服务器。因为便宜。招个人来。给多少钱都行。一般是一开始给一点钱。后面就是维护。不给钱了。再要钱就会告诉你。你现在遇到的问题不就是你前面没有解决的吗?目测这个老板是做销售的出身。想要花最少的钱。做最多的事
    RangerWolf
        20
    RangerWolf  
       2021-01-07 23:16:45 +08:00
    很有诚意的帖子,赞一个楼主!
    祝你们越走越远,原来越顺利!
    RangerWolf
        21
    RangerWolf  
       2021-01-07 23:17:11 +08:00
    啊啊啊 打错字, 越来越顺利。。。
    YouLMAO
        22
    YouLMAO  
       2021-01-08 00:36:04 +08:00 via Android
    楼主我都会,但最少你表示最低价格吧,否则万一差 50 倍就白聊了
    AkideLiu
        23
    AkideLiu  
       2021-01-08 02:21:38 +08:00 via iPhone
    隐约觉得不是缺钱,而是存在法律风险。
    10g 带宽,10 亿数据,爬虫+反编译。

    瞎说的,勿喷 /doge
    jwangkun
        24
    jwangkun  
       2021-01-08 09:01:38 +08:00
    @lancelee01 我们可以交流一下,我们公司目前正在大规模的使用
    sunchuo
        25
    sunchuo  
    OP
       2021-01-08 09:59:06 +08:00
    buliugu
        26
    buliugu  
       2021-01-08 10:59:42 +08:00
    Minio 分布式部署的需求基本上可以用 k8s 部署来解决,不过自带的 Prometheus metrics 只有实例数据,每个租户给独立 minio 集群嘛?
    lyc1116
        27
    lyc1116  
       2021-01-08 17:34:28 +08:00
    Elasticsearch 的需求这个不是上云对机器能解决的,中文支持->中文分词(机械,字典等),实时索引,首字母搜索->doc 量大需要优化 wildcar query,纠错->speelcheck 索引,后面可能还需要优化召回和排序。
    sunchuo
        28
    sunchuo  
    OP
       2021-01-08 17:52:41 +08:00
    calmzhu
        29
    calmzhu  
       2021-01-09 01:01:37 +08:00
    其他不评论。
    不过 20 倍成本这个认真的吗,不带这么尬黑的。
    阿里云 2vCpu 8G 内存 5M 固定带宽的月租是 387. 所以你们一个月同样服务器成本是 19 块?

    服务器功率全部按接近待机的功率算 200W 。一个月大概 0.2Kw * 720h = 144 kwh 。每度电两毛。电厂现在已经这么丧心病狂了么。
    sunchuo
        30
    sunchuo  
    OP
       2021-01-10 01:23:03 +08:00
    @calmzhu

    虽然你抬杠的角度刁钻并且很有道理的样子。但是仔细看我 10 楼的回复。
    我们服务器的配置基本上是你说的配置每一项乘以 16 or 8 。

    calmzhu
        31
    calmzhu  
       2021-01-10 14:28:00 +08:00
    @sunchuo
    我已经算你们的服务器硬件成本为零 了。配置乘多少差别不大。

    你看看服务器的功算算电费就可以了。这还没算数据中心的空调。

    真建数据中心,服务器本身硬件费用并不是大头。

    羡慕你杠的无知
    calmzhu
        32
    calmzhu  
       2021-01-10 14:37:47 +08:00
    @calmzhu

    自建机房的成本。服务器硬件+服务人力+ 服务器电费消耗+空调电费消耗。前两者已经给你抹了当零算了。只要开机算,电费就会超过云的二十分之一
    calmzhu
        33
    calmzhu  
       2021-01-10 14:40:42 +08:00
    @calmzhu
    真建数据中心,服务器本身硬件费用并不是大头。这句话说错了。是想表达,并没有比其他费用高出一个数量级的程度
    calmzhu
        34
    calmzhu  
       2021-01-10 15:22:12 +08:00
    @sunchuo

    有一点确实看错了。也不是自建数据中心。而是整租机柜或者单个机位。所以不考虑电费。

    按照我们之前租的电信机房整机柜。销售谈过的价格是 6w/年。每组机柜 13 台 2U 48 核 256G 服务器插满。每台每个月成本大概是 384.6 元.差不多也就是机房电费了。

    阿里云上 256G 内存没有 48vCPU,按通用型 ecs.g5.16xlarge 32vCPU 单月购买价格的 20 分之一大概是 400.这大概就算你算的大概 20 倍成本的数据来源吧。但是请注意这是只购买一个月一台接下款的价格。有量有长期谈一下轻松减半(官方直售超三年都是直接半价)
    lancelee01
        35
    lancelee01  
       2021-01-11 09:15:15 +08:00
    @jwangkun 可以呀,WX:bGFuY2VsZWVkZXY=
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1066 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 23:07 PVG 07:07 LAX 16:07 JFK 19:07
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86