有关代码都修改调试成功—-2017-4-22叔写。

连锁代码已经修改调试成功—-2017-4-22

描绘一个php脚本,读取第1开的结果langref.txt并分析出title和link,插入第2书写创建的数据库表index里.

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

二、运行

运作我就算不多说了,直接运行main.py就吓了,相关的参数变一下就算好了。有点基础之应都见面。

写一个php脚本,抓取页面http://php.net/manual/en/langref.php右的目录列表.运行此脚论想获取如下输出:

一、说明

1.靶网址:知乎登入后的首页

2.实现:如图字段的爬取

图片 1

zhihu_question表:

图片 2

zhihu_answer表:

图片 3

3.数据:存放于百度网盘,有亟待之可以拿取
链接:http://pan.baidu.com/s/1qYQ6rk4 密码:ociz

zhihu_question表结果:

图片 4

zhihu_answer表结果:

图片 5

  • 第二题

老三、学习笔记

照档爬取知乎的问题与回复的有关消息。本档以及伯乐在线品种多,新知识就是是一个效仿登录。

  • 答:

季、问题—-欢迎留言提出问题

1.临时尚未生十分的问题解决不了,后期如果碰到再贴出


设若照项目针对你生因此要让我平粒star,万分感谢。

怀念只要看代码请走我之github:https://github.com/pujinxiao/zhihu_spider

作者:今孝

出处:http://www.cnblogs.com/jinxiao-pu/p/6748042.html

正文版权归作者和博客园共有,欢迎转载,但未经作者同意要保留这个段子声明,且以文章页面明显位置让有原文连接。

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

写一长长的shell命令,执行这命令可落到http://php.net/manual/en/langref.php的内容连拿页面里之兼具大写的PHP转成为多少写,最后用结果保存至/tmp/langref.html里.

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

以jQuery写一个function来解析langref.php右侧的目录列表,运行此function返回如下一个object.

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

(加分题) 改写下边的脚本,使得当接收到SIGINT信号时打印出”caught signal
SIGINT, exit”并退出.

代码如下:

代码如下:

  • 答:

  • 第五题

  • 答:

  • 第七题:

代码如下:

  • 第三题
  <?php
        //  从文件读取
        $title = $link = array();
        $fp    = fopen('langref.txt', 'r');
        while ($line = fgets($fp)) {
            if (strpos($line, ']')) {
                continue;
            }
            $strArr    = explode('(', $line);
            $title[]   = $strArr[0];
            $strArr[1] = trim($strArr[1]);
            $link[]    = str_replace(')', '', $strArr[1]);
        }
        fclose($fp);
        //  入库
        $conn = new mysqli('127.0.0.1', 'php_manual_user', 'php_manual_pass', 'php_manual');
        if ($conn->connect_error) {
            die('Error:' . $conn->connect_error);
        }
        foreach ($title as $key => $value) {
            $sql = 'INSERT INTO `index` (title, link) VALUES ("' . $value . '", "' . $link[$key] . '")';
            echo $sql;
            if (true === $conn->query($sql)) {
                echo 'Insert ' . $key . 'line successful<br>';
            } else {
                die('Cannot insert the data to mysql' . $conn->connect_error);
            }
        }
        $conn->close();
    <?php
    function request($config)
    {
        if (empty($config['url'])) {
            return false;
        }

        $ch = curl_init($config['url']);
        curl_setopt($ch, CURLOPT_HEADER, 0);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        if (!empty($config['https'])) {
            curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);
            curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);
        }
        if (!empty($config['method']) && 'post' == $config['method']) {
            curl_setopt($ch, CURLOPT_POST, 1);
            curl_setopt($ch, CURLOPT_POSTFIELDS, $config['postfields']);
        }
        $msg   = curl_exec($ch);
        $error = curl_error($ch);
        if (!empty($error)) {
            $msg = curl_errno($ch) . ': ' . $error;
        }
        curl_close($ch);
        return $msg;
    }
    $config['url'] = 'http://php.net/manual/en/langref.php';
    $str           = request(array('url' => 'http://php.net/manual/en/langref.php'));
    $reg           = '/<ul class=\'parent-menu-list\'>([\s\S]*?)<\/ul>/';
    preg_match($reg, $str, $liStr);
    $liStr = $liStr[1];
    $reg   = '/<a href="(.*?)".*?>(.*?)<\/a>/';
    preg_match_all($reg, $liStr, $finalStr);
    $str = '[' . date('Y-m-d H:i:s') . '] fetching ' . $config['url'] . PHP_EOL;
    echo '[' . date('Y-m-d H:i:s') . '] fetching ' . $config['url'] . '<br>';
    sleep(1);
    $str .= '[' . date('Y-m-d H:i:s') . '] parsing start' . PHP_EOL;
    echo '[' . date('Y-m-d H:i:s') . '] parsing start<br>';
    sleep(1);
    $str .= '[' . date('Y-m-d H:i:s') . '] the right side list is:' . PHP_EOL;
    echo '[' . date('Y-m-d H:i:s') . '] the right side list is:<br>';
    foreach ($finalStr[1] as $key => $value) {
        $str .= $finalStr[2][$key] . '(http://php.net/manual/en/' . $value . ')' . PHP_EOL;
        echo $finalStr[2][$key] . '(http://php.net/manual/en/' . $value . ')<br>';
    }
    sleep(1);
    $str .= '[' . date('Y-m-d H:i:s') . '] parsing end' . PHP_EOL;
    echo '[' . date('Y-m-d H:i:s') . '] parsing end<br>';
    sleep(1);
    $str .= '[' . date('Y-m-d H:i:s') . '] saving to file langref.txt' . PHP_EOL;
    echo '[' . date('Y-m-d H:i:s') . '] saving to file langref.txt<br>';
    file_put_contents('langref.txt', $str);
    sleep(1);
    echo '[' . date('Y-m-d H:i:s') . '] saved<br>';
    file_put_contents('langref.txt', '[' . date('Y-m-d H:i:s') . '] saved' . PHP_EOL, FILE_APPEND);

创一个数据库php_manual,新建表index,这个表来3单字段: id, title,
link.
然后创建一个数据库用户php_manual_user,密码是php_manual_pass.
拿上述数据库导出成sql,把SQL语句贴到下面,使得我们于mysql命令行终端里实施这些sql语句可以成功上述操作.

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

(加分题)
有一个超级大的int数组要求跟,假设有1000W,写一个php脚本,根据当下机械(假设是差不多对的)cpu的核数,fork出这么多子进程,把数组平分,每个子进程计算中一些,并拿结果保存到/tmp/子进程pid.txt.
最终父亲进程汇总并出口求诸结果.

作者:何广宇

链接:https://www.zhihu.com/question/19757909/answer/13621166

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    [2016-12-17 13:44:30] fetching http://php.net/manual/en/langref.php
    [2016-12-17 13:44:31] parsing start
    [2016-12-17 13:44:32] the right side list is:
    PHP Manual (http://php.net/manual/en/index.php)
    Copyright (http://php.net/manual/en/copyright.php)
    PHP Manual (http://php.net/manual/en/manual.php)
    Getting Started (http://php.net/manual/en/getting-started.php)
    Installation and Configuration (http://php.net/manual/en/install.php)
    Language Reference (http://php.net/manual/en/langref.php)
    Security (http://php.net/manual/en/security.php)
    Features (http://php.net/manual/en/Features)
    Function Reference (http://php.net/manual/en/funcref.php)
    PHP at the Core: A Hacker's Guide (http://php.net/manual/en/internals2.php)
    FAQ (http://php.net/manual/en/faq.php)
    Appendices (http://php.net/manual/en/appendices.php)
    [2016-12-17 13:44:33] parsing end
    [2016-12-17 13:44:34] saving to file langref.txt
    [2016-12-17 13:44:35] saved
  • 第一题
<?php
    while (1) {
        echo "\n\n";
        echo "I am doing something important\n";
        echo "if i am interruptted, the data will be corrupted\n";
        echo "be careful\n";
        echo "\n\n";
        sleep(3);
    }
#  前提是已经以root权限登录
#  删除原来已经存在同名数据库
drop database if exists `php_manual`;
#  创建数据库
create database `php_manual`;
#  选择需要操作的数据库
use `php_manual`;
#  删除原来已经存在的同名数据表
drop table if exists `index`;
# 创建数据表
create table `index` (
    id int unsigned auto_increment primary key,
    title varchar(255) not null,
    link varchar(255) not null
)engine=InnoDB auto_increment=1 default charset=utf8;
#  创建用户名密码
create user `php_manual_user`@'%' identified by 'php_manual_pass';
# 退出命令行模式
exit;
# 命令行下执行以下命令导出数据库
mysqldump -uphp_manual_user -pphp_manual_pass php_manual > D:/php_manual.sql
  • 答:
{
    "Copyright": "http://php.net/manual/en/copyright.php",
    "PHP Manual": "http://php.net/manual/en/manual.php",
    "Getting Started": "http://php.net/manual/en/getting-started.php",
    "Installation and Configuration": "http://php.net/manual/en/install.php",
    "Language Reference": "http://php.net/manual/en/langref.php",
    "Security": "http://php.net/manual/en/security.php",
    "Features": "http://php.net/manual/en/Features",
    "Function Reference": "http://php.net/manual/en/funcref.php",
    "PHP at the Core: A Hacker's Guide": "http://php.net/manual/en/internals2.php",
    "FAQ": "http://php.net/manual/en/faq.php",
    "Appendices": "http://php.net/manual/en/appendices.php"
}
  • 第四题
  • 答:
  • 答:
  • 答:

  • 第六题:

相关文章

网站地图xml地图