Blog - Title

  • 微软亚太区数据库技术支持组 官方博客

    SQL Server性能问题案例解析 (3)

    • 0 Comments
    今天的博客是SQL Server 性能问题解析系列的最后一个案例。这个案例背景是用户反映以下查询语句执行时间过长,执行时间为10秒以上(已经排除了blocking原因),希望将执行时间压缩到2秒以内。 declare @Company as varchar (10) set @Company = 'a' declare @SystemVersion as varchar(30) set @SystemVersion = 'Total Ticketing Solution v2...
  • 微软亚太区数据库技术支持组 官方博客

    SQL Server性能问题案例解析 (2)

    • 0 Comments
    语句执行时间长是SQL Server 性能问题的一种典型表现形式。当运行一条语句所需要的CPU时间较长或者所需的内存资源较多时,我们往往需要对目标语句本身进行调优。通常情况下,我们可以通过更新统计信息,修改索引,使用语句执行计划的强制选择(使用Hint), 以及对于语句本身的修改来使得语句占用更少的CPU时间或者内存。 在对问题语句调优之前,我们需要得到这条语句的执行计划。除了通过SQL Server Management Studio上的 "Include Actual Execution Plan...
  • 微软亚太区数据库技术支持组 官方博客

    SQL Server性能问题案例解析 (1)

    • 0 Comments
    今天的博客将分享一个死锁的案例。阅读本文之前,需要对SQL Server的锁,事务,隔离级别有基本的了解。网络中有很多文章,我就不在这里复述了。 SQL Server中有一个叫做deadlock monitor的线程,会定期去检测死锁。如果检测到死锁发生,deadlock monitor会选择一个session作为victim 终止,从而解决死锁。在排查死锁时,我们通常建议客户开启trace flag 1222并抓取sql server trace用于分析。当开启了trace flag 1222...
  • 微软亚太区数据库技术支持组 官方博客

    SQL Server连接问题案例解析(3)

    • 0 Comments
    本文是SQL Server 连接问题案例解析系列的最后一个博文,在今天的案例中,除了分析Netmon日志,还会分享一些分析ODBC Trace的经验。 首先来介绍一下这个案例中客户遇到的问题: 客户在Linux服务器上使用UNIXODBC2.3.0将客户端连接到SQL Server数据库。当客户端连接运行在同一个实例中的非镜像数据库时,没有任何问题发生。但如果客户端连接镜像数据库,则会出现以下报错: client=n/a (n/a) unixODBC-2.3.0 64-bit ...
  • 微软亚太区数据库技术支持组 官方博客

    AzureML中的回归

    • 0 Comments
    在Microsoft Azure Machine Learning中提供了以下几种回归模型: 贝叶斯线性回归 Bayesian Linear Regression 提升决策树回归 Boosted Decision Tree Regression 决策森林回归 Decision Forest Regression 快速森林分位回归 Fast Forest Quantile Regression 线性回归 Linear Regression 神经网络回归 Neural...
  • 微软亚太区数据库技术支持组 官方博客

    Storm介绍

    • 0 Comments
    Apache Storm是一个分布式的,容错的,开源的计算系统。它允许我们使用Hadoop来进行实时数据处理。Storm的解决方案还能保证数据都被处理,它有能力对首次处理不成功的数据进行重新处理。根据一些性能方面基准测试,Storm可以达到每个节点每秒处理超过百万的Tuple。 那么为什么要用HDInsight里的Storm呢?在HDInsight服务里的Apache Storm是一个整合在Azure环境里的托管的集群。它提供了几个主要好处: 作为一个托管服务,它能够达到三个9...
  • 微软亚太区数据库技术支持组 官方博客

    AzureML中的聚类

    • 0 Comments
    聚类是一种无监督的机器学习。在聚类中,目标是为了把相似的对象归组到一起。通常聚类算法可以分成以下几类: Partitioning分区:可以把数据集分成k个分区。每个分区对应于一个簇。 Hierarchical 分层:基于数据集,分层会通过自下而上或者自上而下地创建簇。在自下而上的方式中,算法开始把每个项分派给一个簇,在算法从层次网上移动的时候,它把个别相似的簇归并成更大的簇。这样一直继续下去知道所有的簇都归并到一个也就是层次的根节点。在自上而下的方式中,算法是把所有项目都归于一个簇...
  • 微软亚太区数据库技术支持组 官方博客

    SQL Server连接问题案例解析(2)

    • 0 Comments
    在本篇博文中,我将为大家介绍一个在使用数据库镜像功能时发生的连接超时问题。关于数据库镜像的关键概念和术语,在之前的博客 数据库镜像故障转移后,.NET应用程序连接SQL Server 超时(译文) 中已经有了详细的介绍,这里不再赘述,大家可以参考前文。 问题描述 ======== 客户想要在Lync上安装一些组件,在后端需要从英国站点向澳大利亚站点的SQL Server建立连接时会如下错误: 英国站点: 服务器: lyncdben01 澳大利亚站点: ...
  • 微软亚太区数据库技术支持组 官方博客

    SQL Server 连接问题案例解析(1)

    • 2 Comments
    Microsoft Network Monitor(Netmon)是由微软发布的一款网络协议数据分析工具,利用Netmon可以捕获网络数据并进行查看和分析。在处理SQL Server 的连接问题时,Netmon常常会起到关键的作用。在本篇博文中,我将为大家分享一个通过使用 Netmon 解决的经典案例。 在这个案例中,客户发现在客户端的 SQL Server Management Studio 中执行某一个Query时就会发生错误,错误信息是“connection forcibly...
  • 微软亚太区数据库技术支持组 官方博客

    Windows Azure SQL 数据库介绍系列 (4)

    • 0 Comments
    本文是Windows Azure SQL 数据库介绍系列最后一个博文,我们将给大家介绍的是SQL数据库的监控和审计功能。 监控 SQL数据库的性能和运行状态决定着您的业务负载是否可以流畅的读取和写入数据,并为用户提供良好的访问体验。因此作为一个管理员,您需要随时了解数据库的各项运行指标。Windows Azure为您提供了一种十分便利的监控与管理方式,您只需通过Windows Azure 管理门户,即可直观的通过图表看到这些信息。 通过Windows Azure管理门户->...
  • 微软亚太区数据库技术支持组 官方博客

    数据库镜像故障转移后,.NET应用程序连接SQL Server 超时(译文)

    • 0 Comments
    在本篇博客中,我将为大家解析一个有趣的现象。这个现象产生的起因是我的一个客户在数据库发生故障,数据库转移到镜像服务器上后,产生了连接超时错误。为了能够更好地理解这个问题,在我正式进行讲解之前,先来介绍一些有关数据库镜像的关键概念和术语。 为了提升数据库的可用性能力,SQL Server 在2005版中第一次引入了数据库镜像技术。它是一种软件解决方案,对硬件设施没有要求。在镜像功能中,对发生在主体数据库上的每一次插入、更新、删除操作,都要在镜像数据库上尽可能快地重新实现,我们将此行为称为“重做...
  • 微软亚太区数据库技术支持组 官方博客

    数据科学与机器学习

    • 0 Comments
    什么是数据科学呢?数据科学是从数据中获取有用的洞察的实践。我们现在已经能够获取海量数据了,但是却缺乏真正有价值的信息。数据科学提供了强大的处理过程和技术帮助我们从数据海洋中获取可行动的信息。数据科学涉及多个学科领域,包括统计学,数学,运筹学,信号处理,语言学,数据库与存储,编程,机器学习和科学计算等等。虽说“数据科学”这个词汇对商务来说是新的,它其实在上世纪六十年代就被Peter Naur提出,特指计算机科学中的数据处理。在九十年代的时候知名统计学家 C.F. Jeff Wu和...
  • 微软亚太区数据库技术支持组 官方博客

    HBase的介绍

    • 0 Comments
    HBase是一个典型的非关系型的数据库(NoSQL)。它是运行在Hadoop Distributed File System上的,基于行的,提供带有容错机制的存储,能够快速访问大量的稀疏数据。它还添加了事务处理能力到Hadoop中,允许用户更新,插入和删除。它是基于Google的Big Table白皮书在Hadoop上的实现。 抽象来说,HBase是一个稀疏的,分布式的,读写一致的,多维的排序映射。它是从一组键值(Keys)到值(Value)的映射。数据单元格是按照键值的字典序来存储的。每个键值实际上由以下几部分组成...
  • 微软亚太区数据库技术支持组 官方博客

    用HDInsight进行中文处理(系列一)

    • 0 Comments
    对于大数据处理而言,文字方面的处理一直是一个非常重要的应用领域。在本系列里面,我们将针对中文文字的处理,借用大数据平台HDInsight做一些尝试。 HDInsight的本源其实是Apache Hadoop, 是用Java语言开发的。HortonWorks把它移植到了Windows平台,微软又把它架到了云端。Hadoop提供了一个非常有意思的方式,称为Streaming,通过控制标准输入输出流,我们可以很巧妙地使用任何其他语言来编写MapReduce的程序。微软提供的SDK本身也是基于这样一个方式...
  • 微软亚太区数据库技术支持组 官方博客

    Windows Azure SQL 数据库介绍系列 (3)

    • 0 Comments
    我们知道对于本地的传统SQL Server数据库,数据灾备和高可用方案是非常重要的,那么当数据库运行在云中时,我们应该对灾备和高可用性有哪儿些考虑和方法呢?本文将介绍Windows Azure SQL 数据库提供的灾备和高可用性功能。 首先,Azure SQL 数据库有内置的高可用性的子系统可以在数据中心的个别服务器或设备失败时保护你的数据库。 Azure SQL数据库将数据的多份备份维护在不同的物理节点,这些物理节点的物理位置都是完全独立的子系统,以减少由于单个服务器组件,比如硬件,网络接口适配器或是整个服务器发生故障造成的停机...
  • 微软亚太区数据库技术支持组 官方博客

    Windows Azure SQL 数据库介绍系列 (2)

    • 0 Comments
    在 上篇博文 中我们讲述了如何创建一个SQL 数据库的具体步骤。在有了一个可使用的SQL 数据库后,我们如何可以将在自己本地已存在的SQL Server数据库迁移到云上的数据库中呢?本文将给大家介绍将本地数据库迁移到 Microsoft Azure SQL 数据库或者在 Azure 中的服务器之间进行迁移的主要几种方法。 迁移准备: 迁移数据库需精心规划,以确保应用程序能够持续正常运行。请考虑以下事项: 如果数据库包含 Azure SQL Database 所不支持的对象...
  • 微软亚太区数据库技术支持组 官方博客

    Windows Azure SQL 数据库介绍系列 (1)

    • 3 Comments
    在之前的博文中,我们介绍了Windows Azure虚拟机中的SQL Server,本系列会给大家详细介绍微微软云中另一个数据库服务 - Windows Azure SQL 数据库。 本文将是一个Windows Azure SQL 数据库的一个入门介绍,在之后的系列文章中会给大家介绍更多功能。 微软云的中国服务是由中国公司 21Vianet(世纪互联) 运行和提供的,其数据中心位于中国大陆境内。以下内容主要来自世纪互联在线文档。 如果您想充分利用SQL Server 的优势,而又不想负担维护和修补操作系统和应用程序所需的开销...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列9 - AlwaysOn 可用性组

    • 0 Comments
    AlwaysOn对于SQL Server 2014已经不再是新名词,现在也有越来越多的客户还是使用并且钟情于AlwaysOn。它继承了数据库镜像和故障转移群集的优点,使得SQL Server具有更好的高可用性。在SQL 2014中AlwaysOn的特性有哪些加强呢? 1. 和Hekaton (In-memory OLTP)相结合 In-memory OLTP是SQL 2014中最闪亮的新特性了, 而AlwaysOn也同样可以很好地兼容他。你可以在已经定义在AlwaysOn的Availability...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列8 – 可更新的列存储索引 (Updateable Column Store Indexes)

    • 0 Comments
    传统的关系数据库服务引擎往往并不是对超大量数据进行分析计算的最佳平台,为此,SQL Server中开发了分析服务引擎去对大笔数据进行分析计算。当然,对于数据的存放平台SQL Server数据库引擎而言,也是需要强大的数据处理能力的。 在SQL Server 2012时,SQL Server 引入了列存储索引,用以显著提供高传统数据仓库类型语句的性能,并在SQL Server 2014中做了进一步加强。本文将在对SQL Server 2012列存储索引简单介绍的基础上,进一步解释SQL Server...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列7 –针对基数估计的新设计(New Design for Cardinality Estimation)

    • 1 Comments
    对于SQL Server数据库来说,性能一直是一个绕不开的话题。而当我们去分析和研究性能问题时,执行计划又是一个我们一直关注的重点之一。 我们知道,在进行编译时,SQL Server会根据当前的数据库里的统计信息,在一定的时间内,结合本机资源,挑选一个当前最佳的执行计划去执行该语句。 那么数据库分析引擎如何使用这些统计信息的呢?数据库引擎会根据数据库里的统计信息,去计算每次操作大约返回多少行。这个动作称之为基数计算(cardinality estimation)。数据库分析引擎会基于这些信息判断选择逻辑或物理的操作符...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列6 – 缓存池扩展 (Buffer Pool Extension)

    • 0 Comments
    SQL Server 2014缓存池扩展 (Buffer Pool Extension)功能可以将缓存池扩展到较快的SSD存储上。为内存比较紧张的系统提供了新的扩展途径。 Buffer Pool 扩展可以带来以下好处。 1. 提高随机I/O的吞吐量 2. 降低I/O延迟 3. 提高单位时间内处理事务的吞吐量 4. 显著地提高读性能 5. 以软件方式为客户实现了类似于混合硬盘的效果。 缓存池扩展支持以下两种模式 CW:只向SSD写入干净页。 DW...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列5 – IO资源调控器

    • 0 Comments
    在本文中,我们将来看看SQL Server 2014在资源调控器方面增加了哪些新的功能。资源调控器(Resource Governor)是从SQL Server 2008开始出现的一项功能。它是用于管理 SQL Server 工作负荷和系统资源使用情况的功能。 在SQL Server 2014之前,资源调控器只能限制某些用户访问SQL Server所占用的CPU带宽、内存资源。但是随着虚拟化和云技术的发展,IO的控制有了很大的需求。IaaS(Infrastructure as a Service...
  • 微软亚太区数据库技术支持组 官方博客

    SQL 2014新功能介绍系列4 - 延迟事务持续性(Delayed Durability Transactions)

    • 0 Comments
    在SQL Server 2014之前, SQL Server提交事务是一个同步的过程,也就是说,只有当SQL Server将该事务相对应的日志记录写入到了磁盘文件之后,才会返回事务提交成功的信号。这也是为了体现事务4个基本特性中的持久性(Durability)而实现的功能。只有这样,我们才能保证当SQL Server因为某些原因突然Crash之后,再重启的时候,那些已经提交但还没有写入到数据文件上的记录可以通过日志文件进行恢复,或者那些还没有提交,但已经有部分数据写入到数据文件上的记录进行回滚。所以...
  • 微软亚太区数据库技术支持组 官方博客

    浅析微软大数据平台HDInsight (4) 分布式文件系统(下)

    • 0 Comments
    上一章我们探讨了Hadoop中的Windows Azure Blob Storage文件系统的基本结构,本章我们主要来探讨微软Windows Azure Blob Storage文件系统的高可用性和负载均衡。 写的一致性和高可用性 所有的写,都是在log的最后扩展下去的。它是扩展在那个log的最后一个extent的后面。 它做到了数据写的一致性。我们来看看它是如何达到一个extent的复制能保证写的一致性的: 首先它保证extent的append的顺序在3个replica上是一样的...
  • 微软亚太区数据库技术支持组 官方博客

    浅析微软大数据平台HDInsight (3) 分布式文件系统(中)

    • 0 Comments
    上一章我们探讨了Hadoop中的HDFS文件系统,本章我们主要来探讨微软HDInsight平台特有的Windows Azure Blob Storage文件系统。 说到WABS,我们首先解释下什么叫BLOB. 所谓的Blob,就是Binary Large Object,二进制大对象。在Windows Azure的存储上面,把这种二进制大对象具体分为2种。 一种被称为Block Blob,以块为单位的Blob。它主要是为了stream一类的负载服务的。 每个Blob由一组有顺序列表的块组成...
Page 1 of 8 (184 items) 12345»