1、Python中__init__ 和__new__的区别


2、整个爬虫的工作流程(如何运作)


3、http的响应码(最好是记住200到500状态每个的前三个)


4、进程、线程、协程的区别


5、多线程和多进程介绍一下


6、如何实现多进程和多线程


7、python并发和并行


8、redis数据库的事务


9、redis的五大数据类型


10、redis的有序集合


11、mysql 数据库的索引


12、mysql数据库中如何给用户权限


13、Linux查看磁盘命令以及磁盘占用命令


14、Linux查看内容使用情况命令


15、命令行如何实现对一个文件的去重


16、Python的内存管理机制


17、Python的可变数据类型和不可变数据类型


18、Python 中类方法、类实例方法、静态方法有何区别?


19、map 函数


20、解释一下什么是闭包?


21、函数装饰器的理解


22、Python生成器的原理


23、Python 的魔法方法


24、正则里match 与search 的区别?


25、url 的形式?


26、varchar 与char 的区别?


27、常见的反爬虫和应对方法?


28、验证码的解决?


29、描述下scrapy 框架运行的机制?


30、scrapy五大核心组件介绍一下,分别是做什么用


31、怎么实现栈


32、深拷贝,浅拷贝的区别?


33、Linux查看某个进程占用的端口号


34、有一个数组,取出第三大的数字,要求时间复杂度为O(n),请问如何实现

 

35、目标:对指定网站进行数据抓取


       要求:撰写爬虫策略调研报告


              1、列明遇到困难,解决问题方法、策略或建议


              2、时间1小时。