Amazon EMR
Apache Spark, Hadoop, HBase, Presto, Hive ve Diğer Büyük Veri Altyapılarını Kolayca Çalıştırın ve Ölçeklendirin
Amazon EMR, dinamik olarak ölçeklendirilebilen Amazon EC2 bulut sunucularındaki çok miktarda verinin işlenmesini kolay, hızlı ve hesaplı hale getiren bir yönetilen Hadoop altyapısı sağlar. Amazon EMR'de Apache Spark, HBase, Presto ve Flink gibi diğer popüler dağıtılmış altyapıları çalıştırarak Amazon S3 ve Amazon DynamoDB gibi diğer AWS veri kaynaklarındaki verilerle de etkileşim kurabilirsiniz.
Amazon EMR, günlük analizi, web dizini oluşturma, veri dönüştürme işlemleri (ETL), makine öğrenimi, finansal analiz, bilimsel simülasyon ve biyoenformatik dahil olmak üzere çok çeşitli büyük veri kullanım örneklerinin gereksinimlerini de güvenli ve güvenilir bir şekilde karşılar.
Avantajlar
Kullanımı kolay
Dakikalar içinde bir Amazon EMR kümesi başlatabilirsiniz. Düğüm tedarik etme, küme kurulumu, Hadoop yapılandırması veya küme ayarlama konusunda endişelenmeniz gerekmez. Amazon EMR, sizin analize odaklanabilmeniz için bu görevleri halleder.
Düşük maliyetli
Amazon EMR fiyatlandırması basit ve öngörülebilirdir: En az bir dakikalık bir ücretin üzerine kullandığınız her saniye için saniyelik ücret ödersiniz. Saatlik yalnızca 0,15 USD kadar düşük bir ücret karşılığında 10 düğümlü bir Hadoop kümesi dağıtabilirsiniz. Amazon EMR, Amazon EC2 Spot ve Rezerve Edilmiş Bulut Sunucuları için yerel destek sağladığından, temel bulut sunucularının maliyetinden de %50-80 arası tasarruf sağlayabilirsiniz.
Esnek
Amazon EMR ile dilediğiniz ölçekteki verileri işlemek için bir, yüzlerce veya binlerce işlem bulut sunucusu tedarik edebilirsiniz. Bulut sunucusu sayısını manuel olarak ya da Auto Scaling ile kolayca artırıp azaltabilirsiniz ve yalnızca kullandığınız kadar ödersiniz.
Güvenilir
Kümenizi ayarlamaya veya izlemeye daha az zaman harcayabilirsiniz. Hadoop'u buluta uygun olarak ayarlayan Amazon EMR, kümenizi de izleyerek başarısız olan görevleri yeniden dener ve düşük performanslı bulut sunucularınızı otomatik olarak değiştirir.
Güvenli
Amazon EMR, bulut sunucularına ağ erişimini denetleyen Amazon EC2 güvenlik duvarı ayarlarını otomatik olarak yapılandırır ve kendi tanımladığınız yalıtılmış bir ağ olan Amazon Virtual Private Cloud'da (VPC) küme dağıtabilirsiniz. Amazon S3'te depolanan nesneler için EMRFS ile Amazon S3 sunucu tarafı şifreleme veya AWS Key Management Service ya da müşteri tarafından yönetilen anahtarlarla Amazon S3 istemci tarafı şifreleme kullanabilirsiniz. Başka şifreleme seçeneklerini ve Kerberos ile kimlik doğrulamasını da kolayca etkinleştirebilirsiniz.
Esnek
Kümeniz üzerinde eksiksiz denetime sahip olursunuz. Her bulut sunucusuna kök erişiminiz vardır, kolayca ek uygulamalar yükleyebilirsiniz ve her kümeyi önyükleme eylemleriyle özelleştirebilirsiniz. Ayrıca, özel Amazon Linux AMI'leriyle Amazon EMR kümeleri başlatabilirsiniz.
Kullanım örnekleri
Tıklama akışı analizi
Amazon EMR, kullanıcıların segmentlere ayrılması, kullanıcı tercihlerinin anlaşılması ve daha etkili reklamlar sunulması amacıyla tıklama akışı verilerinin analiz edilmesi için kullanılabilir.
Gerçek zamanlı analitik
Amazon EMR'de Spark Streaming ile Amazon Kinesis, Apache Kafka veya diğer veri akışlarından gerçek zamanlı verileri kullanın ve işleyin. Hata toleranslı bir yöntemle akış analizi gerçekleştirin ve sonuçları Amazon S3 veya HDFS'ye yazın.
Günlük analizi
Amazon EMR, web uygulamaları veya mobil uygulamalar tarafından oluşturulan günlüklerin işlenmesi için kullanılabilir. Amazon EMR, müşterilerin petabaytlarca yapılandırılmamış veya yarı yapılandırılmış veriyi, uygulamaları veya kullanıcıları için kullanışlı öngörülere dönüştürmesine yardımcı olur.
Ayıklama dönüştürme yükleme (ETL)
Amazon EMR, büyük veri kümeleri üzerinde sıralama, toplama ve birleştirme gibi veri dönüştürme iş yüklerini (ETL) hızlı ve hesaplı bir şekilde çalıştırmak için kullanılabilir.
Tahmine dayalı analitik
Amazon EMR'de Apache Spark, ölçeklenebilir makine öğrenimi algoritmaları için MLlib'i içerir veya kendi kitaplıklarınızı kullanabilirsiniz. Spark, verileri bellek içinde depolayarak yaygın makine öğrenimi iş yükleri için harika performans sağlayabilir.
Genomik
Amazon EMR, çok yüksek miktarlardaki genomik verilerini ve diğer büyük bilimsel veri kümelerini hızla ve verimli bir şekilde yönetmek için kullanılabilir. Araştırmacılar, AWS üzerinde ücretsiz olarak barındırılan genomik verilerine erişebilir.
Blog gönderileri ve makaleler
AWS'yi kullanmaya başlayın
AWS ile oluşturmaya başlayın
Amazon EMR hakkında daha fazla bilgi edinin







