比如 https://www.36kr.com/p/1932814869170564 ,通过访问获取的是 js 和一些编码信息,没法通过 jsoup 这样的工具去解析 html 内容。
1
xiao109 2022-09-27 10:35:37 +08:00
跟豆瓣一样执行他的解码 js 文件获取实际的编码信息,不然就用无头浏览器然浏览器去执行 js 渲染一次。
|
2
raphaell2e 2022-09-27 11:28:31 +08:00
|
3
SleepyRaven 2022-09-27 11:28:59 +08:00
研究了一下,Sources 面板打开 app.[hash].js 可以看到 window.initialState.state 的 AES.decrypt 信息
|