网址,在这个时代,我们越来越多地需要接触它。就是那个 http:// 的东西。这里面有很多学问的,搞明白了,不一定需要神马 360,我们自己就可以保护自己了。
是的,我说的就是下面这条“央视新闻”。
一、网址的结构
网址,高大上的叫法是 URL,它就是把网上某个东西在什么地方这个信息,用一种规范的写法写出来,让机器可以识别而已。
为了接地气(我也找不到什么大家都熟悉的良心网站),我们就从下面这个大家都熟悉的网址说起。
网址分为这几部分(我省略了不常有的部分):
- 连接协议 (http)。网站实际上用的是一种叫做 HTTP 的协议,“协议”相当于去这个网站拿东西,拿回来的东西用什么信封装。对于网页,现在用得最多的有 HTTP (明信片)和 HTTPS (信封,S 的意思是 secure)两类。
- 主机名 (baike.baidu.com)。相当于网站在哪条巷子。英文的域名是为了方便人记忆而出现的,访问时,它会被翻译成数字编码的 IP 地址,再查找位置。
- 路径、文件名、参数等部分 (view/172029.html)。这个部分就相当于要获取的内容,表示格式一般跟硬盘存储文件的地址是一致的,斜杠代表文件夹,文件带扩展名 (.html)。但实际上,网站想怎么定义这个格式都可以。
注意这三个部分怎么分割开(这很重要!),冒号前就是连接协议,冒号后的 // 表示“路径开始”,它后面跟第一个单独出现的 / 之间的就是主机名,之后就是路径了。
二、关于域名
主机名这个部分,绝大部分情况下会用域名表示。如果你遇到一个网站用数字编码的 IP 地址表示网址……这种情况下,光用 IP 地址来判断网站真伪就不大容易,我就不讲了。
但是域名就简单多了。域名是有专门机构(ICANN)和规则在管理的,掌握这套规则是很容易的。
我们看 baike.baidu.com。域名被 . 号分成了很多节。我们理解域名的时候,要从右到左看,这个时候层次排列是从大到小的。
先看 com。第一节代表域名的种类,其实叫域名后缀。现在有两大类域名,国别域名 (.cn, .us, .hk) 和国际域名 (.com, .net, .org)。国别域名很好理解,属于各国管理。国际域名意思是不特属于某个国家的,最常用的有 .com = company 公司,.net 网络提供商,.org = organization 组织。现在已经有各种奇奇怪怪的国际域名出现了,比如 .xxx, .ninja, .biz 啥的。
上面提到的域名后缀,相应的域名都是只要有空位有钱,就能随意申请的,比如我不是公司,照样可以申请 .com 域名。特例是 .gov 和 .edu,申请的时候需要证明材料。
所以看第二节,baidu。baidu.com 属于一个“顶级域名”,人们可以注册到的域名通常就是顶级域名。而顶级域名下面会有二级域名、N 级域名啥的,如 baike.baidu.com 就是二级域名。二级域名和以上的域名不需要花钱申请,是拥有顶级域名的人说了算的,想怎么用都行。
因此,看一个网站是哪里的,就是看顶级域名这个部分了。比如我可以搞一个 www.baidu.com.2b.phy25.com,不管前面写了什么,它的顶级域名依然是 phy25.com,跟百度并没有什么关系。但这种办法经常会用来骗小白……
三、我们来做一些练习(网址纯属虚构)
www.icbcsop.com
这个打开出来可能是一个工行的页面,但真的是官方的吗?
注意 ICBC 后面混进了一些奇奇怪怪的东西(sop),可能不是最官方的网址。输入自己的个人信息的时候要小心了。
实际上,这是一个诈骗网站。而宇宙行(工行别称)的官方域名是 icbc.com.cn。
www.guangdongdianxin.cn.com
广东电信全拼,很可疑嘛。然后 .cn.com 总感觉哪里不对。
嗯,注意,.com 是国际域名,所以 cn.com 就不是中国管理的域名了,而是有个很牛掰的人注册到这个域名,然后开始把他的二级域名拿去卖钱(而 com.cn 是中国管理的)。
看到这种奇怪的后缀,需要多加一点警惕,因为这种后缀一般不是官方机构管理,注册会便宜一些,没钱的骗子或没钱的个人网站会使用。大站通常不会选这种域名。
实际上,广东电信网址是 gd.189.cn。以上那个是假的。这种时候最好是善用搜索,把域名拿去搜索一下看看,就能准确判断域名对不对头了。
www.taobao.jljssb.kfegdj.tk
这个是淘宝大抽奖网站吗?这个 进了就是煞笔.kfegdj.tk 并不是淘宝啊亲!
另外,.tk 是某个小国的国别域名,那个国家想赚钱,就把它搞成免费 + 收费域名了。和上面的 .cn.com 一样,没钱人会用。所以如果你准备访问一个大站的话,看到它要小心些。
mmbiz.qpic.cn
又是什么鬼!完全猜不出是干什么的域名。(是的,本节为进阶知识,看不懂就算了)
是的,其实一开始我也判断不出来这个域名正不正宗。实际上,百度一下,结果也很难判断(没有人说它是假域名)。
但微信里有人给我发了这个地址呢。祭出大招,查 WHOIS 信息。域名注册时,注册人的 WHOIS 信息是会公开的。尽管有些人为了保护隐私,会使用不是自己的信息,但是大公司一般都会实名的。
百度上搜一下 whois 查询,随便找一个网站进去查,然后结果就出来了。
此处腾讯、阿里同时出现,有点喜感……解释一下,“注册商”是卖域名的,“注册人”是买家。万网这家人前几年被阿里收购了。根据“注册人”这一栏,这个域名相对可信。
查 Whois 是比较麻烦,但比较靠谱的判断方法。虽然 Whois 可以随便填,但一般的骗子都不会填成公司名的,他们一般填的是个人或隐私保护。
t.cn/R2KsmGM
熟悉网络的孩子都知道,这是新浪微博的短网址服务。它可以把或长或短的网址缩成那种形式,访问的时候再跳转,方便长话短说。类似的还有 dwz.cn、163.fm 等。
看到这种,因为你还不知道会跳到真网站还是假网站,所以别紧张,打开它之后再看域名,再判断。(实际上,我收过电信的短信,官方就发了一个 t.cn 的地址,你不点也得点啊。)
以上这一节的内容有些复杂,有些没看懂也没事,看着觉得奇怪的网址,怀疑一下就是了。
四、实践一下
下面这些网址靠谱吗?(重点是怎么看出来的)
http://jscz.ncz-10086.com
http://wap.icbcsap.com
http://m.10010.cn
https://fir.im/rnzr
http://jd100.b0.upaiyun.com
http://www.cexbank.com
做完上面的判断,再看下面的答案。
http://jscz.ncz-10086.com - ncz 是什么鬼?百度的第一页的网址没出现这个域名(百度没有收录,一般诈骗网站也不愿意被百度收录 = =),假的。
http://wap.icbcsap.com - sap 是什么鬼?搜索一下,百度排在第一的是 icbc.com.cn,不一样。假的。
http://m.10010.com - 看起来很简洁的域名,不像假的。百度一下,有收录。其实是真的啦。
https://fir.im/rnzr - 光看网址不知道是什么,还有 HTTPS。实际上试着直接输入域名,你会发现这是一个有各种程序可以下载的地方,说不定下了个别人传的木马,小心咯。(关于程序,估计我会发一篇来讲讲,反正别随便装就是了)
http://jd100.b0.upaiyun.com - 京东吗?那 upaiyun 又是什么鬼?百度一下,查不到结果。试着访问 upaiyun.com,看不懂没关系,这其实是一个提供网盘服务的公司(暂且这么叫吧),说不定别人传了钓鱼网站在上面,那小心一点吧。
http://www.cexbank.com - 光大银行网址是 www.cebbank.com,不用多说了。假的。
实际上,上面有些域名来自“不可信的央视新闻微博”的那条知识帖(我是来黑央视的)。其中都很容易判断是假的。
五、结尾
本期概括起来不是很容易,上面第四节就相当于总结吧。
以上并不能完全避免你受骗,但可以拦住很多弱智的诈骗了 :)。只要觉得不对头的时候,抬头看一下域名,就是了。当然,防骗最重要的是要有意识,你 High 起来的时候就是不看网址,那也没人能拦住你。
最后一个小彩蛋,在微信内嵌浏览器里,页面拉到最顶,再向下拉,可以看域名,确认网站靠不靠谱。支付宝也是支持这样做的。