从工业界到学界盘点SAS与R优缺点比较
摘要:虽然它在业界仍然由SAS主导,但R在学术界广泛使用,因为它的免费开源属性允许用户编写和共享他们自己的应用程序 然而,由于缺乏SAS经验,许多获得数据分析学位的学生很难找到工作。
摘要
虽然它在业界仍然由SAS主导,但R在学术界广泛使用,因为它的免费开源属性允许用户编写和共享他们自己的应用程序。 然而,由于缺乏SAS经验,许多获得数据分析学位的学生很难找到工作。 与此同时,他们面临着从熟悉的R转变为SAS的痛苦。 理想的情况是,您需要知道所有可能的编程语言都能最适合工作。 当然这基本上是个白痴。 我们的目标是展示这两种截然不同的语言的优势,并充分发挥其优势。 我们还指出了那些多年没有使用SAS并且现在正在使用R语言的人的一些误解和偏见,因为他们很少关注SAS的发展和进步。
前言
我们选择SAS和R的原因是因为它们是统计领域中两种最主要的编程语言。 现在我们注意到一个不好的现象是,在学术界大量使用R的用户认为R在SAS所占据的行业中具有相当大的优势。 但是,掌握这两个软件对于数据分析来说是一项很小的成就。 这对年轻人来说至关重要。 教授对特定软件的误解和偏好往往对学生有不利的指导。 因此,有必要指出教授们并不懒惰。 某种语言的主观偏好会影响学生的钱。
对于通常不了解缺乏技术跟进的非SAS程序员来说,SAS通常会有一些更新有点慢。 SAS绘图模块是快速发展和增长的一个例子。 然而,许多人没有注意到这些升级,所以他们仍然固执地使用R绘图。 另一个鲜为人知的SAS示例是SAS可以轻松定制功能。 这是R的优势。这个SAS流程步骤PROC具有全面的语法检查,信息文档和技术支持。 但是,新用户可能根本不知道这些工具是否可用。 此外,SAS还拥有一系列优秀的培训课程和大量有关不同主题资源的用户组的书籍。 了解并使用这些技术和工具有助于减少使用SAS的恐惧。
相关问题讨论
本文比较了两种语言在我们学院遇到的常见误解中的优缺点。 当然,还有更多的论据正在进行中,但在本文中,我们将选择最常见的讨论。 我们希望消除误解,并尽可能向无法及时跟进R或SAS的分析师提供尽可能多的信息。
1.统计方法的新发展
SAS
优势SAS软件和算法经SAS验证,具有快速满足用户需求的技术支持。 如果需要,SAS将尝试在现有步骤中嵌入新方法,例如添加选项或添加语句语句,以便用户无需学习其他流程步骤。 SAS还将发布最新的通讯,详细介绍软件更新。 缺点更新升级速度较慢。
[R
优点用户可以快速实现新方法或查找现有包。 学习和理解新方法很容易,因为学生可以在代码中看到这些功能。
R文档的缺点都是由用户完成的,因此新方法没有经过很好的调试和测试。 开发人员分散在各地,不在一起进行团队开发。
SAS和R在这个问题上的优缺点是互补的。 对于认为其代码是开放的人,您可以看到R是如何工作的。 对于有相关背景的人来说,这更容易理解。 但是,对于SAS,其处理步骤是预加载文件以存储大量用于不同语句语句和选项Option的数学公式。 如果用户真的想要查看底层程序,这也很容易实现。 对于这两种语言的用户来说,无论是学生还是其他只是运行代码的用户,这两种语言都没有区别。 运行SAS时,您无需知道它在做什么。 它类似于你运行R时调用的函数。你所做的就是遵循规则。
2.绘图
SAS
优点SAS绘图模块变得更加灵活,复杂且易于使用。 在一些分析过程步骤PROC中,ODS Graphics可以自动生成一些图形而无需额外的代码。 这允许用户再使用默认图表生成图表或者自己创建个性化图表。
缺点背后的模板语言TL庞大且不易使用,尤其对于初学者而言。 新的高级功能(如交互式绘图功能)对于初学者来说也很难掌握。
[R
优点很简单,可以生成漂亮的图表和循环语句来生成动画。
缺点R中的图表功能独立于统计分析。 绘图和分析是相互独立的。 用户必须自己决定哪种图形是合适的。 结果的质量取决于用户的统计背景和偏好。 虽然改变图形以达到特定的尺寸或角度并不是一件简单的事情。
SAS 9.2之前的图表功能不足是R更具吸引力的主要原因之一。 R的最佳功能之一是其高质量和易于使用的图表功能。 但是,目前使用ODS Graphics和SG进程的SAS / GRAPH为该软件增加了图形功能。 结合使用ODS图形和PROCS,用户可以轻松生成与分析相关的演示图表。 PROC SGPLOTSGPANEL和SGSCATTER等特定的绘图处理步骤对于实现某些代码来说越来越必要。 SAS中还有其他一些很好的绘图选项,例如SGDESOGNER和SAS Enterprise Guide。
3.功能和可重用代码
SAS
优点SAS具有许多功能和自定义功能,可用于DATA和PROC步骤。 另一种强大而无所不能的宏语言,也可用于DATA步骤和PROC步骤。 宏变量可以定义为本地或全局类型。
缺点编写自定义函数和详细的宏代码需要深入的编程知识以确保正确性。
[R
优点在R中编写函数很简单。 用户还可以通过将自己的功能上传到R-CRAN来与其他用户共享自己的功能。
缺点编写自定义函数需要深入的编程知识以确保正确性。 变量是严格的局部变量。
此时,这两个软件具有相似的优点和缺点。 SAS的早期用户主要依靠宏程序的编写来运行他们自己的自定义函数,这就是R用户认为它效率低且繁琐的原因。 但是,SAS 9版本的PROC FCMP允许用户编写SAS版本9.2的个性化功能,并允许用户在DATA和PROC步骤中调用这些功能。 这对简单的统计函数很有用。 对于更复杂的统计函数,它也可以用IML语言实现。
SAS和R语言都面临有效和正确的功能使用。 这要求用户在函数编写过程中具有深入的编程背景。 从一个好的角度来看,程序员需要知道他们写的是什么危险。 其他人可以下载SAS宏或P包,即使他们不知道它们如何工作或甚至不知道它们的正确性。 因此,正确理解宏和函数,然后共享它们并将它们应用于特定需求是很方便的。
4.免费软件
SAS
优点带有OnDemand版本的SAS软件可免费提供给学位代理机构。
缺点Real SAS和JMP不是免费的。 OnDemand版本对要使用的操作系统有一些限制,并且报告运行缓慢。
[R
优势R完全免费。
缺点开源软件存在大公司的安全问题。
SAS向教育机构提供的免费替代方案保证了教授在教室中的使用。 注意OnDemand的安装过程和速度。 简而言之,SAS和JMP不是需要使用许可证来使用该软件的免费公司。 R可以免费安装,但参与辩论的许多博客认为,如果使用SAS的公司使用R,他们将花费比SAS许可费用更多的资源和财务资源,例如重写代码,建立新团队,招募 新的。 专业人士等。 对于分析结果需要经受严格测试要求的公司,SAS可能更合适。 没有现有分析框架的小公司可以探索是选择长寿,资源丰富的现收现付SAS,还是选择免费的软件,但需要其他前期投资,例如 员工的知识,编写和调试代码。 最终,从时间和金钱角度衡量SAS和R的成本可能很接近。
5.用户支持
SAS
优势SAS拥有丰富的在线参考专业技术支持专业培训课程,许多优秀的出版书籍都是密切的用户群和在线社区。 SAS问题可以直接发送给技术支持部门,他们将与用户合作。 缺点真的没有来。
[R
Advantage R有一个很好的样本手册在线参考资料R邮件列表和R方。
缺点用户依赖于其他用户对软件的意见和建议。 由于R的开发人员分散在世界各地,因此全世界的用户都缺乏联系。 包软件包不是由R软件开发核心团队编写的,这导致了程序的不完善,有时会怀疑结果的正确性。 找到特定于问题的人或团队也很困难。
SAS提供的出色支持是其以客户为中心的设计的亮点。 SAS支持的优势是初学者的理想选择,其丰富的细节使有经验的用户受益。 R更令人困惑的参考文献和稀缺的技术支持很难找到帮助。 这与R的开发设计师的初衷相反。
6.数据处理
SAS
优点SAS可以处理任何类型和格式的数据。 DATA步骤专为数据管理而设计,因此SAS擅长处理数据。 使用丰富的SAS选项,您可以处理大数据处理和PROC SQL以减少运行时间。
缺点在DATA步骤中,SAS中的DATA步骤具有非表达式循环算法,因此需要更改用户的编程思路以符合SAS运行逻辑。
[R
Advantage R最初被认为更适合大数据。 它对矩阵的设计和操作非常有效。 R还可以执行各种基于分析的数据模拟。
缺点R的设计更关注统计计算和绘图功能。 因此,数据管理非常耗时,并不像SAS那样清晰。 其中一个主要原因是难以掌握R中针对不同类型数据的数据处理。
数据处理的重要性在统计编程中经常被忽略,但它非常关键,因为实际数据非常糟糕,无法直接应用于分析。 纯粹使用R的学生通常对他们收到的数据抱有不切实际的期望。 学习SAS是解决如何组织原始数据的有效方法。 SAS可以管理和分析大型和复杂的数据集,而R则更多地关注分析。
R的面向对象数据结构在处理复杂数据时遇到许多问题,而R缺乏固有的循环过程。 在SAS中应用标准化工具通常执行以下操作以将复杂数据集与大量缺失数据合并以生成和修改变量。 R中的复杂数据处理操作不是标准化的,并且经常导致更复杂的过程。
SAS和R软件运行时间的速度取决于任务。 例如,SAS可以使用MEMLIB来使用像R这样的内存(而不是硬盘)来提高运行速度。 但是R中没有这样的硬件驱动程序只能使用内存来执行。
7.安装
SAS
优点所有SAS的分析功能和授权都打包在一起并进行安装。 升级许可证证书非常容易。
缺点首次安装或升级到新版本既费时又麻烦。 但这比告诉学生如何在课堂上使用该软件简单1000倍。 如今,越来越多的学生在课堂上使用Mac系统笔记本,但SAS没有Mac版本,这意味着这些学生不能使用SAS。
[R
Advantage R及其最常用的用户界面RStudio易于在Windows,Mac和Unix环境中安装和打开,安装快捷。
运行的缺点必须知道满足要求的包,然后搜索,安装和了解特定功能。 截至原始文本发布时,每天仍有4,379个可用软件包在增加。 它还增加了搜索的时间和难度,同时提供了更多选择。
用户很难收购SAS。 第一次安装也很麻烦。 但是一旦安装完成,软件本身就会遇到很少的问题。 特殊分析不需要特殊的包装或步骤。 R中的相反安装非常简单,但需要额外安装软件包以进行额外分析,从而浪费了安装软件所节省的时间。
8.报告
SAS
优势SAS通过许多有用的流程步骤生成详细而美观的报告。
缺点可以提供更详细的报告过程,如TABULATE,REPORT等。在正确有效的使用之前,将有一个困难的学习曲线等待您跨越。
[R
优势报告R有很多工具。 Sweave包创建包含文本,表格和图形的PDF文件,其中图形可以使用LaTeX和R命令进行修饰。 另一个新的程序包Knitr可以快速生成具有较少格式限制的Web内容。
缺点R没有生成报告的模式方法,因此您需要花一些时间进行编程。 报告生成是R的一个相对较新的方向,因此它不像SAS那样简单快捷。 Sweave和Knitr是R报告的主要软件包,但很难学习。
沉重报告的用户应该了解这些差异。 虽然学习SAS的报告功能需要一些时间,但一旦掌握了它,它就是有价值和灵活的。 并且来自最基本的学习R的报告功能可能不需要花费与SAS一样多的时间。
结论
我们可以看到关于R和SAS的辩论是三合一的。
第一个就像任何统计编程社区一样。 我们知道这个PK不是最终的赢家。 这两种软件各有利弊。 他们有必要的共存,他们也需要在学术教学中共存。 如果学生能够澄清他们的需求并合理地应用它们,他们将获得更好的结果。 如果你只教一个学生一个软件,它是有限的,这使他们很难发展学习另一个软件的潜力。
第二个用户需要使他们的工具箱保持最新。 SAS和R都有一些很好的学习网站来介绍最新的技术进步。 SAS技术支持网站http://support.sas.com上有许多最新的发展,例如Focus Areas,电子通讯,RSS提要和博客。 R博客网站http://www.r-bloggers.com包含许多用户提供的新闻和练习。
第三个理想是学习两种软件并将其纳入分析。 有许多方法可以尝试IML / StudioIML,例如使用SAS for SAS和SAS,作为SAS的附加功能,或者通过使用SAS X Statement执行外部命令,在SAS中将R代码运行到SAS命令中。 对于R用户,将R转换为SAS 的 用户界面可以同时使用 2 种软件。通过使用两种软件可以使处理及分析数据变得事半功倍而且使所有的用户都满意。
人机验证(Captcha)绕过方法:使用Chrome开发者工具在目标网站登录页面上执行简单的元素编辑,以实现Captcha绕过
牛创网络: " 人机身份验证(Captcha)通常显示在网站的注册,登录名和密码重置页面上。 以下是目标网站在登录页面中排列的验证码机制。 从上图可以
2020-01-26 12:44:09 )9040( 亮了
自动发现IDOR(越权)漏洞的方法:使用BurpSuite中的Autozie和Autorepeater插件来检测和识别IDOR漏洞,而无需手动更改每个请求的参数
牛创网络: "自动发现IDOR(越权)漏洞的方法:使用BurpSuite中的Autozie和Autorepeater插件来检测和识别IDOR漏洞,而无需手动更改每个请求的参数
2020-01-30 14:04:47 )6318( 亮了
Grafana CVE-2020-13379漏洞分析:重定向和URL参数注入漏洞的综合利用可以在任何Grafana产品实例中实现未经授权的服务器端请求伪造攻击SSRF
牛创网络: "在Grafana产品实例中,综合利用重定向和URL参数注入漏洞可以实现未经授权的服务器端请求伪造攻击(SSRF)。该漏洞影响Grafana 3 0 1至7 0 1版本。
2020-08-12 14:26:44 )4361( 亮了
Nginx反向代理配置及反向代理泛目录,目录,全站方法
牛创网络: "使用nginx代理dan(sui)是http响应消息写入服务地址或Web绝对路径的情况。 写一个死的服务地址是很少见的,但它偶尔也会发生。 最棘手的是写入web绝对路径,特别是如果绝对路径没有公共前缀
2019-06-17 10:08:58 )3922( 亮了
fortify sca自定义代码安全扫描工具扫描规则(源代码编写、规则定义和扫描结果展示)
牛创网络: "一般安全问题(例如代码注入漏洞),当前fortify sca规则具有很多误报,可通过规则优化来减少误报。自带的扫描规则不能检测到这些问题。 需要自定义扫描规则,合规性角度展示安全风险。
2020-02-12 10:49:07 )3556( 亮了
整理几款2020年流行的漏洞扫描工具
牛创网络: "漏洞扫描器就是确保可以及时准确地检测信息平台基础架构的安全性,确保业务的平稳发展,业务的高效快速发展以及公司,企业和国家 地区的所有信息资产的维护安全。
2020-08-05 14:36:26 )2579( 亮了
微擎安装使用技巧-微擎安装的时候页面显示空白是怎么回事?
牛创网络: "我们在公众号开发中,有时候会用到微擎,那我们来看一下微擎安装的时候页面显示空白是怎么回事吧
2019-06-08 15:34:16 )2276( 亮了
渗透测试:利用前端断点拦截和JS脚本替换对前端加密数据的修改
牛创网络: " 本文介绍的两种方法,虽然断点调试比JS脚本代码替换更容易,但是JS脚本代码替换方法可以实现更强大的功能,测试人员可以根据实际需要选择适当的测试方法
2020-01-07 09:34:42 )2039( 亮了
从工业界到学界盘点SAS与R优缺点比较
牛创网络: "虽然它在业界仍然由SAS主导,但R在学术界广泛使用,因为它的免费开源属性允许用户编写和共享他们自己的应用程序 然而,由于缺乏SAS经验,许多获得数据分析学位的学生很难找到工作。
2019-07-13 22:25:29 )1859( 亮了
41款APP侵犯用户隐私权:QQ,小米,搜狐,新浪,人人均被通报
牛创网络: "随着互联网的不断发展,我们进入了一个时代,每个人都离不开手机。 但是,APP越来越侵犯了用户隐私权。12月19日,工业和信息化部发布了《关于侵犯用户权益的APP(第一批)》的通知。
2019-12-20 11:28:14 )1781( 亮了