Cookie基础知识
Cookie网页的Cookie(通常简称为“Cookie”,中文常翻译为“饼干”)是网站存储在用户浏览器中的一小段文本信息。 它的主要目的是让网站能够“记住”用户的信息或用户在网站上的行为,从而提供更个性化、更便捷的浏览体验。 以下是Cookie的详细解释: 1. 核心作用:状态管理 HTTP协议(网页访问的基础协议)本质上是“无状态”的。这意味着每次用户点击一个新链接、刷新页面或浏览网站的不同部分时,服务器都会将其视为一次全新的、独立的访问。 Cookie 解决了这个“无状态”问题。它允许网站在用户的浏览器上存储一点信息。当用户下次访问同一个网站时,浏览器会自动将之前存储的Cookie发送回服务器。 这样,服务器就能“认出”这是之前访问过的某个用户(或会话),并根据Cookie中存储的信息来提供相应的内容或服务。 2. 常见的用途: 登录状态保持: 这是最常见的用途之一。当你登录一个网站(如邮箱、社交媒体、购物网站),该网站会放置一个Cookie在你的浏览器中,通常包含一个唯一的会话ID(身份标识)。之后你浏览网站的各个页面时,浏览器都会发送这个Cookie,服务器通过这...
Web服务器备份文件
Web 服务器源代码备份文件 指的是在 Web 应用程序开发、部署、维护过程中产生的,包含当前或历史源代码的文件或数据集合的副本。其主要目的是为了在代码被错误修改、损坏或需要回滚时提供一个恢复点。 备份文件的主要类型与产生方式: 开发者手动创建: 常见后缀: .bak, .backup, .old, .save, ~(临时编辑文件) 添加到原始文件名后 (e.g., index.php.bak, config.inc.php.old)。 行为动机: 在修改关键文件前习惯性地创建一个“安全网”。 编辑器/IDE 自动生成: 交换文件 (Vim): .filename.swp, .filename.swo, .filename.swn。在 Vim 编辑文件时自动生成,用于崩溃恢复。如果编辑异常结束,这些文件会残留。 临时文件/备份 (Emacs, 其他编辑器): filename~, #filename#。 操作系统特定 (macOS): .DS_Store文件存储文件夹的自定义属性(视图设置、图标位置等),泄露目录结构信息。 压缩归档备份: 形式: b...
Robots协议深度解析:爬虫规范与安全实践
Robots协议Robots 协议是网站管理员用来指导网络爬虫(如搜索引擎蜘蛛)如何抓取网站内容的非强制性约定,核心通过根目录下的 robots.txt 文件实现。以下是关键知识点解析: 一、核心作用 访问控制: 告知合规爬虫哪些目录或文件禁止抓取(例如后台、日志、测试页面)。 优化资源: 避免爬虫浪费带宽抓取无价值页面(如重复内容、图片素材库)。 聚焦重点: 引导搜索引擎优先收录重要页面(如使用 Sitemap 指令)。 注意: 非强制约束:恶意爬虫可无视该协议。 不保护敏感数据:robots.txt 本身公开可读,禁止抓取≠禁止访问。 二、robots.txt 文件规范1. 基础语法 位置:必须位于网站根目录(https://example.com/robots.txt)。 编码:UTF-8 文本格式。 指令(区分大小写): 指令 作用 示例 User-agent 指定目标爬虫(* 表示所有) User-agent: Googlebot Disallow 禁止抓取的路径 Disallow: /admin/ Allow 例外允许抓取的...
PHP弱类型特性总结
PHP 弱类型特性总结 表达式 结果 原因 "0e1" == 0 true 科学计数法转数字=0 "0abc" == 0 true 字符串前缀为数字0 "123abc" > 1 true 字符串转数字为123 "0" == false true 空字符串/0在弱类型为假 "0" == null true PHP弱类型自动转换 示例代码<?phpshow_source(__FILE__); // 显示当前文件的源代码include("config.php"); // 包含外部配置文件(可能包含 $flag1 和 $flag2)$a = @$_GET['a']; // 获取 GET 参数 a(@ 抑制错误)$b = @$_GET['b']; // 获取 GET 参数 b(@ ...
