tldextract 开源项目教程

tldextract 开源项目教程

tldextractAccurately separates a URL’s subdomain, domain, and public suffix, using the Public Suffix List (PSL).项目地址:https://gitcode.com/gh_mirrors/tl/tldextract

1. 项目的目录结构及介绍

tldextract 是一个用于从 URL 中提取顶级域名(Top-Level Domain, TLD)的 Python 库。以下是该项目的目录结构及其介绍:

  1. tldextract/

  2. ├── .github/

  3. │ └── workflows/

  4. │ └── tests.yml

  5. ├── .gitignore

  6. ├── .pre-commit-config.yaml

  7. ├── .readthedocs.yml

  8. ├── CHANGELOG.md

  9. ├── CONTRIBUTING.md

  10. ├── LICENSE

  11. ├── MANIFEST.in

  12. ├── README.md

  13. ├── docs/

  14. │ ├── Makefile

  15. │ ├── conf.py

  16. │ ├── index.rst

  17. │ └── make.bat

  18. ├── setup.cfg

  19. ├── setup.py

  20. ├── tests/

  21. │ ├── __init__.py

  22. │ ├── test_tldextract.py

  23. │ └── test_update_snapshot.py

  24. ├── tldextract/

  25. │ ├── __init__.py

  26. │ ├── _version.py

  27. │ ├── cache.py

  28. │ ├── extract.py

  29. │ ├── remote.py

  30. │ └── suffix_list.py

  31. └── tox.ini

主要目录和文件介绍:

  • .github/workflows/tests.yml: GitHub Actions 的配置文件,用于自动化测试。
  • .gitignore: Git 忽略文件列表。
  • .pre-commit-config.yaml: pre-commit 钩子的配置文件。
  • .readthedocs.yml: Read the Docs 的配置文件。
  • CHANGELOG.md: 项目变更日志。
  • CONTRIBUTING.md: 贡献指南。
  • LICENSE: 项目许可证。
  • MANIFEST.in: 打包清单文件。
  • README.md: 项目说明文档。
  • docs/: 项目文档目录。
  • setup.cfg: setuptools 的配置文件。
  • setup.py: 项目安装脚本。
  • tests/: 测试代码目录。
  • tldextract/: 项目源代码目录。
  • tox.ini: tox 的配置文件。

2. 项目的启动文件介绍

tldextract 项目的主要启动文件是 tldextract/__init__.py。这个文件包含了项目的核心功能和入口点。以下是该文件的主要内容:

  1. from .extract import extract

  2. from ._version import __version__

  3. __all__ = ['extract', '__version__']

主要功能:

  • extract: 用于从 URL 中提取顶级域名的主要函数。
  • version: 项目的版本号。

3. 项目的配置文件介绍

tldextract 项目的配置文件主要包括 setup.cfgsetup.py

setup.cfg

setup.cfg 是一个配置文件,用于配置 setuptools 的各个方面。以下是该文件的部分内容:

  1. [metadata]

  2. name = tldextract

  3. version = attr: tldextract._version.__version__

  4. description = Accurately separate the TLD from the registered domain and subdomains of a URL, using the Public Suffix List.

  5. long_description = file: README.md

  6. long_description_content_type = text/markdown

  7. url = https://github.com/john-kurkowski/tldextract

  8. author = John Kurkowski

  9. author_email = john.kurkowski@gmail.com

  10. license = BSD

  11. classifiers =

  12. Development Status :: 5 - Production/Stable

  13. Intended Audience :: Developers

  14. License :: OSI Approved :: BSD License

  15. Operating System :: OS Independent

  16. Programming Language :: Python :: 3

  17. Programming Language :: Python :: 3.6

  18. Programming Language :: Python :: 3.7

  19. Programming Language :: Python :: 3.8

  20. Programming Language :: Python :: 3.9

  21. Programming Language :: Python :: 3.10

  22. Topic :: Internet :: WWW/HTTP

  23. Topic :: Software Development :: Libraries :: Python Modules

  24. [options]

  25. packages = find:

  26. install_requires =

  27. idna

  28. requests

  29. requests-file

  30. python_requires = >=3.6

  31. [options.packages.find]

  32. where = .

setup.py

setup.py 是一个 Python 脚本,用于安装和打包项目。以下是该文件的部分内容:

  1. import setuptools

  2. with open("README

tldextractAccurately separates a URL’s subdomain, domain, and public suffix, using the Public Suffix List (PSL).项目地址:https://gitcode.com/gh_mirrors/tl/tldextract

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...