{"id":1233,"date":"2023-04-17T14:00:07","date_gmt":"2023-04-17T14:00:07","guid":{"rendered":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/?p=1233"},"modified":"2025-06-24T20:52:14","modified_gmt":"2025-06-25T04:52:14","slug":"discovering-holistic-infrastructure-strategies-for-compute-intensive-startups","status":"publish","type":"post","link":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/","title":{"rendered":"Discovering holistic infrastructure strategies for compute-intensive startups"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><em>This is part two of a three-part AI-Core Insights series. <a href=\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/foundation-models-open-source-or-not-open-source\/\">Click here for part one<\/a>, \u201cFoundation models: To open-source or not to open-source?\u201d<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">In the first part of this three-part blog series, we discussed the practical approach towards foundation models (FM), both open and closed source. From a deployment perspective, the proof in the pudding is which foundation model works best to solve the intended use case.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Let us now simplify the seemingly infinite infrastructure needed to realize a product out of compute-intensive foundation models. There are two <a href=\"https:\/\/www.theinformation.com\/articles\/ai-developers-stymied-by-server-shortage-at-aws-microsoft-google?rc=dwmof2\">heavily discussed problem statements<\/a>:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li class=\"wp-block-list-item\">Your fine-tuning cost, needing a large amount of data and GPUs with enough vRAM and memory to host large models \u2013 this is especially applicable if you\u2019re building your moat around differentiated fine-tuning or prompt engineering<\/li>\n\n\n\n<li class=\"wp-block-list-item\">Your inference cost that\u2019s fractional per call but compounds with the number of inference calls\u2014this stays regardless.<\/li>\n<\/ol>\n\n\n\n<p class=\"wp-block-paragraph\">Put simply, the return and investment should go hand in hand. In the beginning, however, this can require a huge sunk cost. So, what do you focus on?<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">The infrastructure dilemma for FM startups<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">If you have a fine-tuning pipeline, it looks something like this:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li class=\"wp-block-list-item\"><strong>Data preprocessing and labeling:<\/strong> You have a big pool of datasets. You&#8217;re preprocessing your data\u2014cleaning it, sizing it, removing backgrounds, etc. You need small GPUs here\u2014T4s, but potentially A10s, depending on availability. Then you label it, perhaps using small models and small GPUs.<\/li>\n\n\n\n<li class=\"wp-block-list-item\"><strong>Fine-<\/strong><strong>tuning:<\/strong> As you start fine-tuning your model, you start needing larger GPUs, famously A100s. These are <a href=\"https:\/\/azure.microsoft.com\/en-us\/pricing\/details\/virtual-machines\/windows\/\">expensive GPUs<\/a>. You load your large model and fine-tune over specialized data and hopefully none of the hardware fails in the process. If it does, you hopefully have minimal checkpoints (which is time-consuming). If it does fail and you had a checkpoint, you try to retrieve your fine-tuning as much as possible. However, depending on how sub-optimal the checkpointing is, you did lose some good few hours anyway.<\/li>\n\n\n\n<li class=\"wp-block-list-item\"><strong>Retrieval and inference:<\/strong> After this, you serve the models for inference. Since the model size is still huge, you host it on the cloud and rack up the inference cost per query. If you need super-optimal configuration, you debate between an A10 and an A100. If you configure your GPUs to completely spin up and down, it lands you in cold-start problem. If you keep your GPUs running, you rack up huge GPU costs (aka investments) without paying users (aka return).<\/li>\n<\/ol>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Note: if you do not have a fine-tuning pipeline, the pre-processing elements are out, but you are still thinking about serving infrastructure. <\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">The biggest decision that relates to our sunk cost conversation is this: What constitutes your infrastructure? Do you A) the infrastructure problem and <em>borrow<\/em> it from providers, while focusing on your core product, or do you B) <em>build <\/em>components in-house, investing time and money upfront, discovering, and solving the challenges as you go? Do you A) consolidate locations, saving on ingress\/egress and many associated costs with regions and zones, or do you B) decentralize it from various sources, diversifying the points of failure but spreading it across zones or regions, potentially creating a latency problem needing a solution?<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">The trend that I see in growing startups is this: focus on your core product differentiation and commoditize the rest. Infrastructure can be a complicated overhead taking you away from the monetizable problem statement, or it can be a big powerhouse with bits and pieces that can easily scale on single clicks with your growth.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Beyond compute: The role of platform and inference acceleration<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">There is a euphemism that I have heard in the startup community: \u201cYou cannot throw GPU at every problem.\u201d How I interpret it is this: \u201cOptimization is a problem that can\u2019t be completely solved by hardware (generally speaking).\u201d There are other factors at play like model compression and quantization, not to mention the crucial role of platform and runtime software such as <a href=\"https:\/\/github.com\/microsoft\/onnxruntime\">inference acceleration<\/a> and <a href=\"https:\/\/learn.microsoft.com\/en-us\/azure\/machine-learning\/reference-checkpoint-performance-for-large-models?view=azureml-api-2&amp;tabs=PYTORCH\">checkpointing<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Thinking of the big picture, the role of optimization and acceleration rapidly becomes centralized. Runtime accelerators like ONNX can give 1.4X faster inference while rapid checkpointing features like Nebula can help recover your training jobs from hardware failures, thus saving the most vital resource: time. Along with this, simple techniques like autoscaling or scaling and workload triggers can help you spin down the number of GPUs sitting idle and waiting for your next burst of inference requests by going back to a minimum where you can scale it up from.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">In the roundtables that we\u2019ve hosted for startups, sometimes the most cash-burning questions are the simplest ones: To manage your growth, how do you balance serving your customers short-term with the most efficient hardware and scale vs. serving them long-term with efficient scale-ups and -downs?<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Summary<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">As we think about productionizing with foundation models, involving large-scale training and inference, we need to consider the role of platform and inference acceleration together with the role of infrastructure. Techniques such as ONNX runtime or Nebula are only a couple of such considerations and there are many more. Ultimately, startups face the challenge of efficiently serving customers in the short term while managing growth and scalability in the long term.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><em>For more tips on leveraging AI for your startup and to start building on industry-leading AI infrastructure, <a href=\"https:\/\/foundershub.startups.microsoft.com\/signup\">sign up today for Microsoft for Startups Founders Hub<\/a>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>This is part two of a three-part AI-Core Insights series. Click here for part one, \u201cFoundation models: To open-source or not to open-source?\u201d In the first part of this three-part blog series, we discussed the practical approach towards foundation models (FM), both open and closed source.<\/p>\n","protected":false},"author":20,"featured_media":1235,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ms_queue_id":[],"ep_exclude_from_search":false,"_classifai_error":"","_classifai_text_to_speech_error":"","_alt_title":"","ms-ems-related-posts":[],"footnotes":""},"post_tag":[],"content-type":[],"job-role":[],"topic":[],"coauthors":[],"class_list":["post-1233","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog<\/title>\n<meta name=\"description\" content=\"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog\" \/>\n<meta property=\"og:description\" content=\"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\" \/>\n<meta property=\"og:site_name\" content=\"Microsoft for Startups Blog\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/Microsoft4Startups\/\" \/>\n<meta property=\"article:published_time\" content=\"2023-04-17T14:00:07+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-06-25T04:52:14+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/AI-Platform_16x9_RGB-1024x536.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1024\" \/>\n\t<meta property=\"og:image:height\" content=\"536\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Nandita Jaya\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/AI-Platform_16x9_RGB.png\" \/>\n<meta name=\"twitter:creator\" content=\"@msft4startups\" \/>\n<meta name=\"twitter:site\" content=\"@msft4startups\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Nandita Jaya\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\"},\"author\":[{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/author\/nandita-jaya\/\",\"@type\":\"Person\",\"@name\":\"Nandita Jaya\"}],\"headline\":\"Discovering holistic infrastructure strategies for compute-intensive startups\",\"datePublished\":\"2023-04-17T14:00:07+00:00\",\"dateModified\":\"2025-06-25T04:52:14+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\"},\"wordCount\":900,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization\"},\"image\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg\",\"articleSection\":[\"News\"],\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\",\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\",\"name\":\"Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog\",\"isPartOf\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg\",\"datePublished\":\"2023-04-17T14:00:07+00:00\",\"dateModified\":\"2025-06-25T04:52:14+00:00\",\"description\":\"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.\",\"breadcrumb\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage\",\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg\",\"contentUrl\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg\",\"width\":960,\"height\":540,\"caption\":\"AI-generated image by lexica.art\/aperture\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Discovering holistic infrastructure strategies for compute-intensive startups\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#website\",\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/\",\"name\":\"Microsoft for Startups Blog\",\"description\":\"Startup insight and inspiration\",\"publisher\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization\",\"name\":\"Microsoft for Startups Blog\",\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2024\/11\/microsoft_logo.webp\",\"contentUrl\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2024\/11\/microsoft_logo.webp\",\"width\":512,\"height\":512,\"caption\":\"Microsoft for Startups Blog\"},\"image\":{\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/www.facebook.com\/Microsoft4Startups\/\",\"https:\/\/x.com\/msft4startups\",\"https:\/\/www.linkedin.com\/company\/microsoftforstartups\/\",\"https:\/\/www.instagram.com\/microsoftforstartups\/\"]},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/person\/c6c36ea4177552c4b22b1d3a72eba6b0\",\"name\":\"Nandita Jaya\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g00a7a1dc2c7a52e12805e36d7b84eb23\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g\",\"caption\":\"Nandita Jaya\"},\"url\":\"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/author\/nandita-jaya\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog","description":"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/","og_locale":"en_US","og_type":"article","og_title":"Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog","og_description":"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.","og_url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/","og_site_name":"Microsoft for Startups Blog","article_publisher":"https:\/\/www.facebook.com\/Microsoft4Startups\/","article_published_time":"2023-04-17T14:00:07+00:00","article_modified_time":"2025-06-25T04:52:14+00:00","og_image":[{"width":1024,"height":536,"url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/AI-Platform_16x9_RGB-1024x536.png","type":"image\/png"}],"author":"Nandita Jaya","twitter_card":"summary_large_image","twitter_image":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/AI-Platform_16x9_RGB.png","twitter_creator":"@msft4startups","twitter_site":"@msft4startups","twitter_misc":{"Written by":"Nandita Jaya","Est. reading time":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#article","isPartOf":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/"},"author":[{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/author\/nandita-jaya\/","@type":"Person","@name":"Nandita Jaya"}],"headline":"Discovering holistic infrastructure strategies for compute-intensive startups","datePublished":"2023-04-17T14:00:07+00:00","dateModified":"2025-06-25T04:52:14+00:00","mainEntityOfPage":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/"},"wordCount":900,"commentCount":0,"publisher":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization"},"image":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage"},"thumbnailUrl":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg","articleSection":["News"],"inLanguage":"en-US","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/","url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/","name":"Discovering holistic infrastructure strategies for compute-intensive startups - Microsoft for Startups Blog","isPartOf":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage"},"image":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage"},"thumbnailUrl":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg","datePublished":"2023-04-17T14:00:07+00:00","dateModified":"2025-06-25T04:52:14+00:00","description":"As we think about productionizing with foundation models, we need to consider the role of platform and inference acceleration together with infrastructure.","breadcrumb":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/"]}]},{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#primaryimage","url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg","contentUrl":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2023\/04\/nandita2.jpg","width":960,"height":540,"caption":"AI-generated image by lexica.art\/aperture"},{"@type":"BreadcrumbList","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/discovering-holistic-infrastructure-strategies-for-compute-intensive-startups\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/"},{"@type":"ListItem","position":2,"name":"Discovering holistic infrastructure strategies for compute-intensive startups"}]},{"@type":"WebSite","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#website","url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/","name":"Microsoft for Startups Blog","description":"Startup insight and inspiration","publisher":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Organization","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#organization","name":"Microsoft for Startups Blog","url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/","logo":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/logo\/image\/","url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2024\/11\/microsoft_logo.webp","contentUrl":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-content\/uploads\/2024\/11\/microsoft_logo.webp","width":512,"height":512,"caption":"Microsoft for Startups Blog"},"image":{"@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/Microsoft4Startups\/","https:\/\/x.com\/msft4startups","https:\/\/www.linkedin.com\/company\/microsoftforstartups\/","https:\/\/www.instagram.com\/microsoftforstartups\/"]},{"@type":"Person","@id":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/#\/schema\/person\/c6c36ea4177552c4b22b1d3a72eba6b0","name":"Nandita Jaya","image":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g00a7a1dc2c7a52e12805e36d7b84eb23","url":"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/3ef8c6b30371ed77667870783a83e5a83c11325ad0e56e201366e06ef569ee0a?s=96&d=microsoft&r=g","caption":"Nandita Jaya"},"url":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/author\/nandita-jaya\/"}]}},"bloginabox_animated_featured_image":null,"bloginabox_display_generated_audio":false,"_links":{"self":[{"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/posts\/1233","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/users\/20"}],"replies":[{"embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/comments?post=1233"}],"version-history":[{"count":2,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/posts\/1233\/revisions"}],"predecessor-version":[{"id":2556,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/posts\/1233\/revisions\/2556"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/media\/1235"}],"wp:attachment":[{"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/media?parent=1233"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/post_tag?post=1233"},{"taxonomy":"content-type","embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/content-type?post=1233"},{"taxonomy":"job-role","embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/job-role?post=1233"},{"taxonomy":"topic","embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/topic?post=1233"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.microsoft.com\/en-us\/startups\/blog\/wp-json\/wp\/v2\/coauthors?post=1233"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}