V2EX sakila
sakila

sakila

V2EX 第 220510 号会员,加入于 2017-03-12 16:42:38 +08:00
26 S 4 B
根据 sakila 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
sakila 最近回复了
2020-04-08 14:47:19 +08:00
回复了 xiao38245 创建的主题 程序员 三年爬虫需要什么技能树?
@scukmh 三年爬虫经验:
1. 熟练使用 python 编写爬虫两年
2. 坐牢一年
----
谢谢兄弟, 有被笑到
2020-04-08 08:31:55 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧
回复不能用 markdown?? 题主将就看吧
2020-04-08 08:31:22 +08:00
回复了 xiangyuecn 创建的主题 程序员 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧
关于这个问题你可以看一下字符的类别, `unicodedata.category(unichr)`可以返回 str 的常规类别([general category]( https://en.wikipedia.org/wiki/Unicode_character_property)). 比如中文或一些外文的的声调符号的 category 是`Mn`.

`unicodedata.normalize(form, unistr)`可以返回 Unicode 字符串 unistr 的普通形式“form”, 有`NFC`, `NFKC`, `NFD`和`NFKD`等, 详细解释见[unicode equivalence]( https://en.wikipedia.org/wiki/Unicode_equivalence)

比如一段代码:

```python
>>> s = 'lusàrski'
>>> print(s)
'lusàrski'
```

现在是 NFC composition 形式, 也就是'' = ''

转换成 NFD decomposition 形式:

```python
>>> print(ascii(unicodedata.normalize('NFD','lusàrski')))
'S\u0301lusa\u0300rski'
```

'' = 'S\u0301'

因此可以写一个 unicode_to_ascii 的函数:

>>> s = 'lusàrski'
>>> def unicode_to_ascii(s):
>>> return ''.join(c for c in unicodedata.normalize('NFD', s)
>>> if unicodedata.category(c) != 'Mn')
>>> print(unicode_to_ascii(s))
Slusarski
```

不知道是否满足题主的问题
@jackchao7432 样本不合理,所以这是一个没有意义的统计
-------
确实不合理,确实意义小,看个乐呵就行

@qwertqwert12345 说样本不合理的人,可以想一想怎么才能囊括所有

我直接说:不可能
-------
同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

@telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
-------
我还真不知道有的高校不提供邮箱, 直觉不太可能吧
即使邮箱在中国高校不怎么常用, 不至于没有吧

@cht1995 想 cv 一下结果花了五分钟都没注册好
-------
哈哈复现过程比较复杂, 代码的技术含量并不复杂

@Perry 很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
-------
同意 不过内网的东西 谁也拿不到吧

@fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
-------
对 比如我 但是我校 laji 邮箱死活收不到 github 验证 于是作罢
@fish267 对 因为邮箱后缀是硬的标识
2019-10-12 11:27:54 +08:00
回复了 wanwushengzhang 创建的主题 程序员 求助! 总被刷票,大佬们给支支招?
@lscho 如果涉及到羊毛的话,加个短信验证码之类的提高刷票成本就行了。
----------------------------------------------------
加短信验证码会不会同时提高自己的成本呢
@sakila 用这俩纯粹因为电脑上装着,顺手。如果没装俩我可能现在会用记事本
我觉得工具不是目的,关键是意识。千万不要陷入一个误区:如果我有了 XXX 工具,我就会 XXX
同理:如果我买了 XXX,我就会 XXX
记住:工具永远是是一个手段,而些什么才是重要的东西。
我一般用 notepad++或 vscode
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     968 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 12ms UTC 18:56 PVG 02:56 LAX 11:56 JFK 14:56
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86