SAS(StatisticalAnalysisSystem)是一个模块化、集成化的大型应用软件系统。
它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。
SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。
SAS系统主要完成以数据为中心的四大任务:数据访问、数据管理、数据呈现和数据分析。
SAS系统究竟有多重要
SAS系统究竟有多重要呢?这么说吧,世界强超过家在用SAS系统,不管你服不服,反正我是服了。
SAS公司近年来被超过30份权威市场调研机构列为市场领导者,包括分析、数据管理、高级和预测分析、客户洞察、零售分析、商业智能、欺诈侦测、安全解决方案等。根据IDC,SAS占全球高级和预测分析市场27.7%的份额,是第二名的两倍以上。
什么是SAS界面?
当需要以交互方式分析数据时,我们就需要使用SAS界面,SAS提供图形化的任务运行方式,易于理解和操作。SAS界面中有许多不同的窗口,它们执行各自的功能。简单说,SAS是帮助非编程技术用户的最有价值的语言之一。
SAS窗口
当进入SAS环境,您看到的第一个窗口是具有大量详细功能的SAS窗口。在窗口的右侧,您将看到一个WorkArea(工作区域),它用于编写所需代码,然后执行所需输出。在窗口左侧,您将看到导航窗格。该窗格导航不同的编程特性。
CodeAuto-Completion代码自动完成
它类似手机上您想输入命令的提示。当编写代码时,它显示一个首字母相同的命令列表。它使代码编写变得容易并防止错误语法。您还会看到对所有SAS语法和建议的全面正确的详解。
例如:在SAS中调用“procedure(程序)”,需要输入“Proc”关键字。
执行SAS程序
执行SAS程序,不需要太复杂的指令,简单的语句也能够执行起来。要执行SAS程序,您只需编写“Run”语句即可。SAS还支持Run的图形化表示。只需要点击左边窗格中的第一个图标即可使用它。
运行SAS程序的快捷方式:运行完成后,按“F3”键即可运行SAS程序。
SAS内置功能
SAS的另一个惊人之处是内置功能支持,比如
功能名称:SAS功能(内置)的名称。
参数:为采取指导性行动,需要为函数提供值,而这个值就是参数。
参数是:
变量
常数表达式
另一个函数
为简化系统和用户操作,根据需要输入的数据类型,将函数分为四类。分别是:
日期和时间函数
角色功能
数学函数
截断函数
日期和时间函数
要处理日期和时间值,可以使用date和time函数。下面列出了在SAS-中操作值(仅日期和时间)的各种内置日期和时间函数
today:这个函数返回当前日期。日期的格式为SAS日期格式。
intck:这个函数返回两个日期之间的月或年的总数的数字计数。
time:该函数返回当前时间。时间格式为SAS时间格式。
weekday:该函数返回给定日期的工作日。
字符函数
要处理字符或字符串值,必须使用字符函数。无需用单独的函数来操作String和Character;可在SAS中通过字符函数来实现。
在SAS中可使用的不同字符函数有:
LOWCASE:该函数可将所有的大写字母转换为小写字母。小写字母将保持原样。
UPCASE:该函数可将字符串中的所有字母转换为大写。大写字母将保持不变。
PROPCASE:该函数将每个字符串的第一个字母转换为大写,其余保持原样。
REVERSE:该函数将反转字符串中的字母大小写。
SCAN::该函数返回给定索引的特定字符串值。
数学函数
数学函数是那些只能用于数值或变量值以执行需要计算的函数集。
以下是各种SAS内置的数学函数,用于特定的计算
MAX:该函数返回给定变量列表中的最大值。
MIN:该函数返回给定变量列表中的最小值。
SQRT:该函数一次返回所有变量值之和的平方根。
RANUNI:该函数从任意一组数值中返回一个随机值。
MEDIAN:该函数首先计算所有变量值的中位数,然后返回它。
截断函数
要截断数值必须使用截断函数。下面是SAS-中内置的截断函数列表
Round:该函数返回给定整数值中最接近的数字。
Int:该函数返回给定数字的小数点前的数字值
Ceil:该函数返回最接近给定整数的最大值。
Floor:该函数返回给定整数值中最小的最大值。
SAS系统,作为全球数据分析领域的领导者,是每一个数据科学家、数据分析师都必备的基本技能。如果你是零基础,想学习SAS系统,可以从《SAS系统使用SASSATA手册》、《SAS应用统计分析》(RonaldCody编著)、《SAS统计分析教程》这几本教材入门,不过0基础自学的难度非常大,需要比较大的悟性和意志力,很多人从入门到放弃只要5分钟。建议大家选择simplilearn圣普伦的数据科学培训课,除了能够学习SAS系统之外,还能够学习R语言数据科学课程和Python语言数据科学,除了拥有行业导师授课之外,还有10个真实行业的实践项目,理论和实践相结合,帮助大家拿到认证的同时,对大家入职后如何快速开展工作也起到巨大的帮助。
点击蓝字