Skip to content

根据提供的微信文章地址,简单的爬取微信文章内容,提取标题、作者、公众号、封面、文章主体、以及文章主体纯文本等信息

Notifications You must be signed in to change notification settings

super1024201/WxCrawler

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

WxCrawler

使用PHP简单的爬取微信文章内容

可以获取的信息包括:文章html富文本,无图html文本,以及文章的基本信息:标题、作者、封面图片、公众号等信息。

使用方式:

$crawler = new WxCrawler();
$content = $crawler->crawByUrl($url);

content数组结构为:

[
    [
        'date' => '',//发布日期
        'title'=> '',//标题
        'digest'=> '',//描述
        'content_url'=> '',//文章链接
        'cover'=> '',//文章封面链接
        'wechatname'=> '',//微信公众号名称
    ],
    'content_html' => '',
    'content_text' => '',
]

About

根据提供的微信文章地址,简单的爬取微信文章内容,提取标题、作者、公众号、封面、文章主体、以及文章主体纯文本等信息

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • PHP 100.0%