automa,我承认我写不出来这样的代码,早年的时候公司想过做一个爬虫的工具,那个时候RPA还没有火,虽然下载也没怎么火.RPA再牛,还是需要工程师,想一点经验都没有人来做,还是理解不了。能够简化数据采集,却不能替换工程师。
1 循环数据问题
如果我想采集的数据,告诉我每页有多少条记录,或者有多少分页,就很容易了。
它这个里面循环数据的选项,除了变量,其他的都无法实现非固定值的分页。
但实际并不是我所想的那样使用。取元素的数量好办,通过js就可以得到
// 得到目录数量
const dir_cn = document.querySelectorAll('.file-list-item').length
automaSetVariable('dir_cn', dir_cn)
得到了数量如何循环呢?先调整思路,从循环元素着手,官方有个示例Extract All Instagram Profile Posts
指定要循环的元素,这里要循环的最大数据,就需要设置了,默认为0,这样循环就可以自动进行。
再取元素的属性值,获取超链接的href
,可以看到这里的css选择器的使用规则,采用的是上面定义的first
,得到值赋值给变量url
2 文件下载
飞书中文件有一个下载为“FreeMind”,这个用automa怎么操作呢?chrome浏览器 调试鼠标悬停后出现的元素样式,这里通过把鼠标放到对应元素,然后点击鼠标右键,同时按键盘上的N可以定位到悬浮窗口的dom节点,只是这种办法鼠标一挪走,就得反复这么操作,有些麻烦,多搞几次就好了。两个同时按,就不会隐藏掉,就容易定位到了。
前面两级菜单都好办,通过元素就可以找到,但是点击“FreeMind”,就有问题,因为它是文件下载。点击没有用