_($0PXQFQ7Y(P~4838LJ_]L.png

管理培训搜索
18318889481 17875936848

财审
| 数据库服务

财税信息库

| 金融会计专题

融资租赁会计 并购会计 期权会计 银行会计 估值管理 贷款公司会计 金融审计 资产管理会计 套期会计 股票会计 金融工具 公允价值计量

| 转创平台
| 法证会计
| 国际财务管理

财政支出绩效评价 国际企业财务管理 国际会计 外商投资 国际财务准则 ISSB动态追踪 转创全球会计 关联申报系列

| 会计中心

医药会计 成本会计 管理会计 无形资产会计 交通会计 政府管理会计 建设会计 涉税会计 工会会计 会计工厂 国企会计 会计监督 会计信息化 商业会计 教育会计 数字会计 财政会计 电子发票

| 财务咨询

财务顾问 财税金融 财务管理咨询 财会资管 内控审核 公共财务总监 财务分析

| 内部审计专题

内部审计 内部控制审计 内部审计规程 公用经费审计 内部审计准则 银行内部审计 内部审计制度 内部审计指南 内审质量评估 房地产企业内部审计

| 审计创新与全球化

信息技术审计ITA 国际审计与内部监督 电子数据处理审计EDPA 数字化函证 国际审计准则与实务 大数据审计 数据采集与审计 区块链审计 信息系统审计 电子数据审计 电子商业汇票跨境支付 可信安全体系

| 代理记账中心

健顺财务咨询 会计园地 会计处理 代理记账 工商注册 账务处理

| 会计师事务所

会计准则 票研社 会计师事务 财务审计 财务风险管理 尽职调查

| 审计中心

风险审计 工程造价审计 物流审计 人力资源审计 预算审计 碳审计 固定资产审计 投标审计 政府审计 资金管理审计 工程审计 行业动态 绩效审计

| 审计及鉴证

审计服务 财务报告审计服务 审计及鉴证服务 上市公司审计 税务审计 风险导向审计

| 专项审计

离任审计 清算审计 专项审计 司法审计 经济责任审计 清产核资 反舞弊审计

| 审计工厂

竣工决算审计 大数据审计 网络安全审计 法证会计 反舞弊中心 财税审计 审计监督 教育内部审计 预决算审计 审计质量评估 绿色审计 审计实务 合规审计 审计信息化 审计之家 审计监督 发票风险管理

| 审计咨询服务

资产评估审计 经济责任审计 资产审计 IPO审计 审计风控 财务审计 财政审计

| python审计实用案例当前您所在的位置:首页 > 财审 > 审计创新与全球化 > 信息系统审计

“网络爬虫”是现今大数据领域获取数据的核心工具,在审计领域,“网络爬虫”技术为信息整合应用提供了全新的技术路径,在现场审计实施时,有些必要的外部数据获取也比较困难,审计部门在材料真实性审查中,经常面临财务信息、非财务信息搜索整合困难,真实性难以判定,借助外部的应用系统数据能为审计提供极大便利。在开展经济责任审计中,审计事项多且审计年限跨度时间长的原因,各种资料提供比较繁杂,整理资料及思路时间比较长。利用“网络爬虫”工具Python从单位或政府公开网站读取下载多年度部门公开预算表、各种公告、各种动态并整理汇集到EXCEL表里,结合本单位重大事项集中决策表,对掌握该单位业务重点、经济活动动向,起到很重要的作用。同时使审计人员做到心里有数,思路清晰,减轻人工下载附件、汇总核实各种数据工作量。

审计目的:将被审单位网站内多年的交易信息、信息公开、新闻公告、发布的内容和发布时间等一并爬取保存到 EXCEL。再利用查询或检索功能将很快找出审计所要信息和内容,不必一页页翻看。 

步骤一:部署Python环境。安装Python代码编辑器,编辑器好几种,都各有特色,这里主要使用Jupyter Notebook ,Jupyter 适合做数据分析。

步骤二:分析网站网页结构。网站地址为:

'http://gzjy.***.gov.cn/jyxx/moreinfojy.html',关键标签:发布时间<div><table> <tr><td>;发文日期:*年*月*日</td></tr></table></div>;项目名称<title>******</title>

步骤三:编写以下代码:

(一)逐步骤分析网页链接,做运行演示,同时可以在Jupyter里看到网页源代码更容易查看关键信息,为下一步做循环抓取做准备,这一步也可以不必写,但是不熟练的人还是写在前面为好,便于后面的循环核心代码编写调试。

1684831840223.jpg

(二)爬取网页的核心代码,有上述步骤的基础编写循环代码就显得比较直观一些,主要考虑循环语句和语法即可,由于交易信息太多2000多页,这里以前50页为列。 

步骤三:

按照步骤二的方式分别获取交易信息、信息公开、通知公告、工作动态等,利用这些内容和审计事项相结合,在重大决策、营商环境、扶贫工作、预算执行情况等经济责任方面作出准确的审计评价并能发现很多账面难以发现的问题。例如:“关于数字证书(CA)互认功能上线试运行的通知”发布时间为2020年6月18日,4家软件服务公司CA数字证书得以互认,经审计人员进一步了解,该单位之前指定招、投标人购买信安软件服务公司一家的产品,换取该公司对本单位部分软件系统免费的后期技术支持、维护、优化、升级等服务项目;从交易信息公告内容里发现该单位在某个时间段之前指定交纳投标保证金至专户,经进一步查实该单位履行政策不到位未推行银行保函制度。

由于现在很多网站设置了反爬虫机制,如果对比所爬取的数据与原数据差异较大,就要针对性设置访问频率,调整爬虫访问间隔时间,同时避免高峰期爬取数据,在初写调试程序之时尽量选取小范围单页面数据进行测试,减少触发反扒机制,避免增加不必要的麻烦。


转创君
企业概况
联系我们
专家顾问
企业文化
党风建设
核心团队
资质荣誉
领导资源
专家库
公司公告
资源与智库
战略合作伙伴
质量保证
咨询流程
联系我们
咨询
IPO咨询
中国企业国际化发展战略
投融资规划
企业管理咨询
人力资源管理
风险管理
竞争战略
集团管控
并购重组
家族办公室
资产管理
股权设计
企业管治与内部审计
企业估值
价值办公室
内控咨询
投资银行
管治、内控及合规服务
法律咨询
服务
管理咨询服务
投融资规划
人力资源
资产评估服务
会计服务
科技服务
资质认证
ESG服务
商务咨询
内部控制服务
转创投服
金融服务咨询
企业服务
财会服务
财审
金融会计专题
法证会计
国际财务管理
会计中心
财务咨询
内部审计专题
审计创新与全球化
代理记账中心
会计师事务所
审计中心
审计及鉴证
专项审计
审计工厂
审计咨询服务
税务
财税中心
转创税务
华税律所
纳税筹划
税收筹划
IPO财税
国际税收
涉税服务
金融
金融风险管理
纳斯达克
并购交易服务
北交所
IPO咨询
深交所
上交所
直通新三板
董秘工作平台
独立董事事务
SPAC
资本市场服务中心
澳洲上市
加拿大上市
估值分析事务
香港联交所
新交所
金融分析师事务所
股权
广东股权交易中心
企业顶层架构设计
股权合规
案例研究
员工激励
股权风险管理
股权顶层设计
股权投资
股权质押
股权设计
知识产权出资入股
股权激励
合规
合规与政府管制
企业合规
网络安全与隐私保护
法证会计与反舞弊
反洗钱与制裁合规
反垄断中心
企业合规管理咨询
合规中心
转创全球企业合规
合规律师事务所
金融安全与合规
海关及全球贸易合规
ESG合规
反欺诈中心
合规中心(产业)
知识产权合规专题
资产评估合规
私募股权基金合规
法信
征信管理
信用中心
法信中心
信用评级
价值办公室
联合资信
国际信用
安企中心
转创法信
诚信管理
法信中国
管理
并购重组
转创国际企业研究所
创新创业
转型升级
知识产权
投融资规划
ESG中心
管理咨询
资产评估
人力资源
IPO咨询
高企认定
法律
刑事法律服务
资本市场法律服务
财税金融法律事务
转创国际合规律师
民商事法律服务
公司法律服务
公共法律服务中心
转创国际法律事务所
转创系
转创网校
转创法信
转创国际合规研究所
中国转创通讯社
转创国际税务师
18318889481 17875936848
在线QQ
在线留言
返回首页
返回顶部
留言板
发送