注册域名的步骤网站优化连云港哪家强?

张小明 2026/1/8 11:06:04
注册域名的步骤,网站优化连云港哪家强?,哪个网站教人做美食,镇江地区做网站的公司0 基本逻辑 1 创建项目 scrapy startproject 项目名字 2 cd 到spiders文件夹下 3 创建爬虫文件scrapy genspider -t crawl 爬虫文件名字 爬取的域名1 settings.py文件中设置日志文件 # 一般不采取这种方式 # LOG_LEVEL WARNING # 推荐使用日志文件的方式 LOG_FILE log.log2 …0 基本逻辑1创建项目 scrapy startproject 项目名字2cd 到spiders文件夹下3创建爬虫文件 scrapy genspider-t crawl 爬虫文件名字 爬取的域名1 settings.py文件中设置日志文件# 一般不采取这种方式# LOG_LEVEL WARNING# 推荐使用日志文件的方式LOG_FILElog.log2 使用scrapy爬取读书网的中书的名字和图片地址2.1 新建项目scrapy startproject 项目名字2.2 新建爬虫名字scrapy genspidef 爬虫名字 域名# 域名如www.baidu.com2.3 在爬虫文件中写爬取逻辑importscrapyfromscrapy.linkextractorsimportLinkExtractorfromscrapy.spidersimportCrawlSpider,Rulefromread_book.itemsimportReadBookItemclassReadbookSpider(CrawlSpider):nameread_bookallowed_domains[www.dushu.com]start_urls[https://www.dushu.com/book/1188_1.html]rules(Rule(LinkExtractor(allowr/book/1188_\d\.html),callbackparse_item,followTrue),)defparse_item(self,response):img_listresponse.xpath(//div[classbookslist]//img)forimginimg_list:nameimg.xpath(./data-original).extract_first()srcimg.xpath(./alt).extract_first()bookReadBook101Item(namename,srcsrc)yieldbook2.4 items.py文件中importscrapyclassReadBookItem(scrapy.Item):namescrapy.Field()srcscrapy.Field()2.5 pipelines.py文件中fromitemadapterimportItemAdapterfromscrapy.utils.projectimportget_project_settings# 加载settings文件importpymysqlclassReadBook101Pipeline:defopen_spider(self,spider):self.fpopen(book.json,w,encodingutf-8)defprocess_item(self,item,spider):self.fp.write(str(item))returnitemdefclose_spider(self,spider):self.fp.close()classMysqlPipeline:defopen_spider(self,spider):settingsget_project_settings()self.hostsettings[DB_HOST]self.usersettings[DB_USER]self.passwordsettings[DB_PASSWORD]self.namesettings[DB_NAME]self.portsettings[DB_PORT]self.charsetsettings[DB_CHARSET]self.connect()defconnect(self,):self.connpymysql.connect(userself.user,passwordself.password,hostself.host,databaseself.name,portself.port,charsetself.charset,)self.cursorself.conn.cursor()defprocess_item(self,item,spider):sqlinsert into book(name,src) values({},{}).format(item[name],item[src])self.cursor.execute(sql)self.conn.commit()returnitemdefclose_spider(self,spider):self.cursor.close()self.conn.close()2.6 settings文件中开启管道、配置数据库DB_HOST127.0.0.1DB_PORT3306DB_USERrootDB_PASSWORDrootDB_NAMEspider01# utf-8不允许使用 - 否则会报错NoneType……DB_CHARSETutf8# Configure item pipelines# See https://docs.scrapy.org/en/latest/topics/item-pipeline.htmlITEM_PIPELINES{read_book_101.pipelines.ReadBook101Pipeline:300,read_book_101.pipelines.MysqlPipeline:301}
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

做网站上海公司单位如何建设网站

PDFMathTranslate终极集成指南:5步实现科研文献翻译自动化 【免费下载链接】PDFMathTranslate PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务&#…

张小明 2026/1/3 5:33:05 网站建设

影响网站速度的代码微信微网站开发

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个适合初学者的INMP441基础教程项目。要求:1. 详细的接线图说明;2. 最简单的音频采集示例代码;3. 通过串口打印音频峰值信息;4…

张小明 2026/1/1 12:58:28 网站建设

黄石网站建设费用.tv做网站怎么样

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 设计一个生产可用的DifyMySQL Docker部署架构,要求:1. 使用Docker Swarm实现多节点部署 2. MySQL配置主从复制 3. 实现配置文件与数据卷持久化 4. 包含Prome…

张小明 2026/1/1 14:30:28 网站建设

网站创建app开发网站 要网站icp经营许可证吗

还在为复杂的J-Link调试工具发愁吗?PyLink让你用Python就能轻松搞定嵌入式设备调试和编程!这个强大的Python库将SEGGER J-Link的功能完美集成到Python生态中,让硬件调试变得像写Python脚本一样简单。 【免费下载链接】pylink Python Library …

张小明 2026/1/1 12:07:44 网站建设

盗qq的钓鱼网站怎么做导购网站一站式建站

使用 Keepalived 实现高可用性及 ownCloud 服务器搭建 在当今的网络环境中,确保应用程序和网站的高可用性至关重要。Keepalived 是一款强大的工具,它能够为应用程序甚至托管网站添加高可用性。同时,ownCloud 作为一款实用的 Web 应用程序,能为组织和个人提供文件同步、联系…

张小明 2026/1/1 17:15:19 网站建设

微博网站开发平台怎么建立一个网站好

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

张小明 2026/1/1 9:31:24 网站建设