HTML 和 URL

目录
  1. 全球资源定位器 (URL)
    1. URL 片断
    2. 相对 URL
    3. 在 HTML 中的 URL
World Wide Web 是 一 个 信 息 资 源 的 网 络. Web 依 靠 三 种 结 构 来 有 意 使 这 些 资 源 为 各 类 用 户 做 好 准 备:
  1. 单 纯 的 命 名 方 案, 提 供 在 Web 上 进 入 资 源 的 统 一 的 方 法 和 路 径 (URLs).
  2. 协 议, 允 许 在 Web 上 交 换 已 命 名 的 资 源 (HTTP).
  3. 超 文 本, 供 在 资 源 之 间 易 于 引 导 (HTML).
在 参 考 手 册 的 这 部 分,  我 们 列 示 了 (最 小 的) 关 于 HTML 的 影 响 的 Web 标 题.

全球资源定位器 (Universal Resource Locators ,URLs)

在 Web 上 的 任 何 可 用 资 源 --- HTML 文 档, 图 像, 影 像, 程 式 等 等 --- 都 有 一 个 地 址 可 被 全 球 资 源 定 位 器 解 码, 或 缩 写 为 (在 [RFC1738] 定 义).

URL 代 表 性 的 包 含 了 三 个 部 分:

  1. 在 Web 上 传 输 资 源 所 使 用 的 协 议 名 称.
  2. 主 管 资 源 的 主 机 名 称.
  3. 资 源 本 身 的 名 称, 用 路 径 表 示.
考 虑 一 人 提 定 这 分 说 明 书  的 URL:
http://www.w3.org/TR/WD-html4/cover.html
这 个 URL 可 以 如 下 阅 读: 使 用 HTTP 协 议 并 且 通 过 www.w3.org 的 机 器 传 输, 而 文 件 是 /TR/WD-html4/cover.html

URL 通 常 是 大 小 写 有 关 的 (除 机 器 名 称 外). 有 明, 可 能 是 整 个 URL, 可 能 是 URL 的 一 部 分 对 大 小 写 并 不 敏 感, 然 而 要 识 别 这 些 并 不 容 易, 用 户 需 要 经 常 判 断 某 个 URL 是 否 大 小 写 有 关./u

在 HTML 中 出 现 的 用 于 URL 的 字 符 在 [RFC1738] 指 定.

URL 片断

URL 在 这 份 文 档 的 写 作 中 指 定 了  en vigeur  ([RFC1738]) 来 提 供 一 种 引 用 资 源 方 式, 但 并 不 一 定 在 同 一 个 资 源 中 定 位. Web 通 讯 接 受 一 种 被 叫 做 "URL 片 断" 的 约 定 来 在 同 一 份 HTML 文 档 中 指 向 一 个 锚 点. 一 个 URL 片 断 用 用 "#" 结 束 后 跟 锚 点. 例 如, 这 里 就 是 个 在 指 向 section_2 锚 点 的 URL 片 断:

http://somesite.com/html/top.html#section_2

相对 URL

一 个 相 对 URL (在 [RFC1808] 定 义) 不 包 括 协 议 或 机 器 信 息, 而 它 的 路 径 通 常 指 定 到 与 当 前 文 档 处 于 相 同 机 器 的 HTML 文 档. 相 对 URL 可 能 包 括 相 对 路 径 的 成 员 (".." 意 味 着 父 目 录) 也 可 能 是 URL 片 断.

相 对 URL 可 能 要 通 过 全 URL 决 定, 例 如 用 户 尝 试 从 某 个 文 档 链 接 到 另 一 个 时. [RFC1808] 定 义 了 标 准 的 相 对 URL 决 定 方 式. 下 面 的 描 述 只 针 对 易 于 使 用 而 言.

简 要 的, 一 个 全 URL 通 过 附 加 一 个 "基 础" 部 分 在 相 对 URL 上 引 申 而 来. 这 个 基 础 部 分 是 一 个 URL 并 且 可 能 包 含 下 列 的 源:

[RFC1808] 指 定 了 大 多 个 基 本 信 息 源 中 的 优 先 权. 为 了 这 种 目 的, 最 后 一 条 基 础 信 息 比 前 者 更 有 优 先 权 并 且 在 HTTP 有 HEAD 信 息 出 现 于 文 档 的 HEAD 信 息 前.

如 果 没 有 显 式 的 基 础 信 息 存 在 于 文 档, 基 础 URL 使 用 与 当 前 文 档 相 同 的 基 信 息.

给 定 一 个 基 础 URL 和 相 对 URL (不 用 斜 线 开 始), 一 个 全 URL 由 此 得 到:

HTML 中的 URL

在 HTML 中, URL 扮 演 如 下 的 角 色: 在 每 种 情 况 下, 作 者 可 以 使 用 全 URL, URL 片 断 或 相 对 URL. 请 查 阅 锚(anchors) 部 分 来 获 得 更 多 的 关 于 URL 和 链 接 的 信 息.

MAILTO URL

扩 展 于?HTTP URL 的, 作 者 可 能 希 望 在 他 们 的 文 档 中 包 含 MAILTO URL (参 见 [RFC1738]). MAILTO URL 引 起 对 某 个 电 子 信 箱 发 送 电 子 邮 件. 例 如, 作 者 可 能 建 立 这 样 一 个 链 接: 当 激 活 时, 引 起 用 户 代 理 器 打 开 邮 件 程 式 并 且 在 "To" 字 段 附 着 目 标 信 箱.

MAILTO URL 使 用 下 列 语 法:

mailto:email-address
用 户 代 理 器 提 供 MAILTO URL 扩 展 功 能 目 前 还 不 是 互 联 网 标 准 (例 如: 附 加 主 题 的 URL 使 用 下 面 的 语 法 "?Subject=my%20subject" 这 里 的 空 格 符 用 "%20" 代 替).