提取出来的url是列表里的元素，每个元素加起来才是完整的url，有大神帮忙么。。-慕课网

2回答

bobby 2021-05-22 18:51:00

我没太懂你的意思，你是要多行匹配吗？正则表达式默认匹配到换行符就不往后匹配了 dotall = re.compile(pattern, re.DOTALL)

0 回复有任何疑惑可以回复我~

提问者 AH7809801 #1

<meta content="always" name="referrer">
<script>
 
    (new Image()).src = 'https://weixin.sogou.com/approve?uuid=' + 'fa19aa76-3477-4f63-81a7-e1ab927efe4a' + '&token=' + '5ACCCF0F96457F48E6E2246189745BFAE702D56160A63434' + '&from=inner';
 
    setTimeout(function () {
        var url = '';
        url += 'http://mp.w';
        url += 'eixin.qq.co';
        url += 'm/s?src=11&';
        url += 'timestamp=1';
        url += '621505034&v';
        url += 'er=3080&sig';
        url += 'nature=66kE';
        url += '3FmQ04OFZvV';
        url += 'iIEe0kzfug2';
        url += 'AFp7HCryJI8';
        url += 'cF31uhAqprwIHQARrwnOlWWXggOPaN8RBpOQFRO19NMem7SDGtgNsgOnaDjZRt8ew*YbNbCPA30mkk-k33skmkP6UC5&new=1';
        url.replace("@", "");
        window.location.replace(url)
    },100);
 
</script>
我就是要提取这段文本的url，但是他是拼接的，我搞了好久了。。。

回复有任何疑惑可以回复我~ 2021-05-22 19:02:35

bobby 回复提问者 AH7809801 #2

这种问题只有自己通过正则表达式提取，或者使用python调用js的执行引擎执行这段逻辑拿到返回值

回复有任何疑惑可以回复我~ 2021-05-24 22:03:55

提问者 AH7809801 2021-05-21 15:09:33

my_str = '''
<meta content="always" name="referrer">
<script>

    (new Image()).src = 'https://weixin.sogou.com/approve?uuid=' + 'fa19aa76-3477-4f63-81a7-e1ab927efe4a' + '&token=' + '5ACCCF0F96457F48E6E2246189745BFAE702D56160A63434' + '&from=inner';

    setTimeout(function () {
        var url = '';
        url += 'http://mp.w';
        url += 'eixin.qq.co';
        url += 'm/s?src=11&';
        url += 'timestamp=1';
        url += '621505034&v';
        url += 'er=3080&sig';
        url += 'nature=66kE';
        url += '3FmQ04OFZvV';
        url += 'iIEe0kzfug2';
        url += 'AFp7HCryJI8';
        url += 'cF31uhAqprwIHQARrwnOlWWXggOPaN8RBpOQFRO19NMem7SDGtgNsgOnaDjZRt8ew*YbNbCPA30mkk-k33skmkP6UC5&new=1';
        url.replace("@", "");
        window.location.replace(url)
    },100);

</script>

'''

0 回复有任何疑惑可以回复我~

收起回答

提取出来的url是列表里的元素，每个元素加起来才是完整的url，有大神帮忙么。。

正在回答回答被采纳积分+3

2回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空